北京大學信息工程學院——張健課題組在計算機視覺方面取得重要研究進展

來源：在職研究生招生信息網(wǎng) 發(fā)布時間：2022-04-15 17:02:13

　　CVPR全稱IEEE國際計算機視覺與模式識別會議(IEEE Conference on Computer Vision and Pattern Recognition），該會議始于1983年，每年舉辦一次，是計算機視覺和模式識別領(lǐng)域的國際頂級會議。根據(jù)谷歌學術(shù)公布的2021年最新學術(shù)期刊和會議影響力排名，CVPR在所有學術(shù)刊物中位居第4，僅次于Nature，NEJM和Science。張健助理教授課題組分別在圖像隱寫/高光譜圖像重建/自然圖像重建等底層視覺研究方向共有3篇論文被CVPR 2022錄用。

　　圖像隱寫術(shù)(Image Steganography)旨在隱秘地將隱藏信息嵌入到一張與宿主圖像近似的容器圖中。此前的隱寫方案通常將隱寫和重建視為兩部分網(wǎng)絡進行構(gòu)建，難以同時保證可靠的重建質(zhì)量和隱秘性；現(xiàn)有技術(shù)對網(wǎng)絡傳輸中的噪聲和壓縮也相當敏感，容器圖上輕微的干擾即可能影響重建質(zhì)量。如圖1所示,論文“Robust Invertible Image Steganography”提出了一種可逆圖像隱寫方法，通過設(shè)計條件標準化流模型（Conditional Normalizing Flow），將圖像的隱寫和解密視作一對逆問題加以聯(lián)合高效求解。為了提升隱寫容量和重構(gòu)質(zhì)量，論文提出了分布映射模塊，能夠給重建過程提供有效引導，從而保留隱藏圖的更多高頻信息。同時，在端到端訓練中引入了對各類失真的模擬，在重建網(wǎng)絡中設(shè)計了圖像增強模塊以提升魯棒性。綜上，論文構(gòu)建了一個強魯棒性的高效圖像隱寫框架，在水印鑒權(quán)、換臉檢測、屏顯隱藏圖像等方面有著廣泛應用。該工作由課題組獨立完成，論文通訊作者為張健助理教授，信息工程學院為第一作者單位，許佑民同學為第一作者，合作者還包括課題組的牟沖同學、胡妤婕同學、謝靜芬同學。

　　光譜壓縮感知被廣泛地應用在成像系統(tǒng)上，其目的是利用二維傳感器來捕捉三維的高光譜信號，進而取得低帶寬、高計算通量的優(yōu)勢。成像系統(tǒng)通過硬件編碼器壓縮二維信號，隨后運用重建算法實現(xiàn)高維信號的復原。然而，現(xiàn)有的方法均存在一定的局限性，如基于模型的方法迭代時間較長，實時性差；基于網(wǎng)絡的方法又缺乏一定的可解釋性。論文“HerosNet: Hyperspectral Explicable Reconstruction and Optimal Sampling Deep Network for Snapshot Compressive Imaging”研究的內(nèi)容是可解釋深度神經(jīng)網(wǎng)絡在光譜壓縮感知上的應用。課題組的研究表明，基于深度展開的方法能夠很好地利用兩種方法的優(yōu)勢，并有效解決現(xiàn)有深度展開方法中缺乏跨階段特征交互和自適應參數(shù)調(diào)整的問題。該研究結(jié)果所設(shè)計的深度展開網(wǎng)絡受優(yōu)化方法中的近鄰映射啟發(fā)，網(wǎng)絡結(jié)構(gòu)如圖2所示，能夠聯(lián)合實現(xiàn)掩膜優(yōu)化和高光譜重建。該網(wǎng)絡通過引入動態(tài)梯度下降模塊來模擬采樣矩陣，自適應地更新迭代步長；該網(wǎng)絡通過層級特征交互模塊，融合之前階段的特征用以重建當前階段的圖像。論文通訊作者為張健助理教授，信息工程學院為第一作者單位，張軒宇同學為第一作者，合作者還包括香港中文大學孫啟霖助理教授、哈爾濱工業(yè)大學（深圳）張永兵教授和北京大學熊瑞勤教授。

　　自然圖像重建具有廣泛的應用價值，可以顯著提升圖像或視頻的視覺質(zhì)量。現(xiàn)有圖像重建方法在性能和模型可解釋性上都存在一定的缺陷。論文“Deep Generalized Unfolding Networks for Image Restoration”針對現(xiàn)有的缺陷研究了可解釋性網(wǎng)絡在自然圖像重建上的應用。研究表明，優(yōu)化啟發(fā)式的網(wǎng)絡設(shè)計在提升模型可解釋性的同時也可以提升模型性能。如圖3所示，論文設(shè)計的新型深度展開網(wǎng)絡由近端梯度下降算法（PGD）展開而成，每個階段的網(wǎng)絡結(jié)構(gòu)由數(shù)據(jù)模塊和先驗模塊交替堆疊而成，其中引入級間跳躍連接來個改進傳統(tǒng)算法中存在的信息損失。通過可學習模塊替換傳統(tǒng)算子，所設(shè)計的模型具有良好的自適應能力，同時保持了良好的可解釋性，在多個自然圖像重建任務中取得了領(lǐng)先性能。該工作由課題組獨立完成，論文通訊作者為張健助理教授，信息工程學院為第一作者單位，牟沖同學為第一作者，論文合作者還包括課題組的王茜同學。

　　以上三項研究成果得到了深圳市基礎(chǔ)研究專項以及國家自然科學基金的支持，在算力方面得到了深圳鵬城實驗室的“鵬城云腦”支持。

評論

1點贊

報名申請

請?zhí)峁┮韵滦畔?，招生老師會盡快與您聯(lián)系。符合報考條件者為您提供正式的報名表，我們承諾對您的個人信息嚴格保密。

姓名*

最高學歷/學位*

請選擇

大專以下大專本科有學位本科無學位碩士博士

手機*

畢業(yè)時間*

請選擇

2027年 2026年 2025年 2024年 2023年 2022年 2021年 2020年 2019年 2018年 2017年 2016年 2015年 2014年 2013年 2012年 2011年 2010年 2009年 2008年 2007年 2006年 2005年 2004年 2003年 2002年 2001年 2000年

所在地區(qū)*

省份