北京大學(xué)信息工程學(xué)院——張健課題組在計(jì)算機(jī)視覺方面取得重要研究進(jìn)展

來(lái)源：在職研究生招生信息網(wǎng) 發(fā)布時(shí)間：2022-04-15 17:02:13

　　CVPR全稱IEEE國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(IEEE Conference on Computer Vision and Pattern Recognition），該會(huì)議始于1983年，每年舉辦一次，是計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的國(guó)際頂級(jí)會(huì)議。根據(jù)谷歌學(xué)術(shù)公布的2021年最新學(xué)術(shù)期刊和會(huì)議影響力排名，CVPR在所有學(xué)術(shù)刊物中位居第4，僅次于Nature，NEJM和Science。張健助理教授課題組分別在圖像隱寫/高光譜圖像重建/自然圖像重建等底層視覺研究方向共有3篇論文被CVPR 2022錄用。

　　圖像隱寫術(shù)(Image Steganography)旨在隱秘地將隱藏信息嵌入到一張與宿主圖像近似的容器圖中。此前的隱寫方案通常將隱寫和重建視為兩部分網(wǎng)絡(luò)進(jìn)行構(gòu)建，難以同時(shí)保證可靠的重建質(zhì)量和隱秘性；現(xiàn)有技術(shù)對(duì)網(wǎng)絡(luò)傳輸中的噪聲和壓縮也相當(dāng)敏感，容器圖上輕微的干擾即可能影響重建質(zhì)量。如圖1所示,論文“Robust Invertible Image Steganography”提出了一種可逆圖像隱寫方法，通過(guò)設(shè)計(jì)條件標(biāo)準(zhǔn)化流模型（Conditional Normalizing Flow），將圖像的隱寫和解密視作一對(duì)逆問(wèn)題加以聯(lián)合高效求解。為了提升隱寫容量和重構(gòu)質(zhì)量，論文提出了分布映射模塊，能夠給重建過(guò)程提供有效引導(dǎo)，從而保留隱藏圖的更多高頻信息。同時(shí)，在端到端訓(xùn)練中引入了對(duì)各類失真的模擬，在重建網(wǎng)絡(luò)中設(shè)計(jì)了圖像增強(qiáng)模塊以提升魯棒性。綜上，論文構(gòu)建了一個(gè)強(qiáng)魯棒性的高效圖像隱寫框架，在水印鑒權(quán)、換臉檢測(cè)、屏顯隱藏圖像等方面有著廣泛應(yīng)用。該工作由課題組獨(dú)立完成，論文通訊作者為張健助理教授，信息工程學(xué)院為第一作者單位，許佑民同學(xué)為第一作者，合作者還包括課題組的牟沖同學(xué)、胡妤婕同學(xué)、謝靜芬同學(xué)。

　　光譜壓縮感知被廣泛地應(yīng)用在成像系統(tǒng)上，其目的是利用二維傳感器來(lái)捕捉三維的高光譜信號(hào)，進(jìn)而取得低帶寬、高計(jì)算通量的優(yōu)勢(shì)。成像系統(tǒng)通過(guò)硬件編碼器壓縮二維信號(hào)，隨后運(yùn)用重建算法實(shí)現(xiàn)高維信號(hào)的復(fù)原。然而，現(xiàn)有的方法均存在一定的局限性，如基于模型的方法迭代時(shí)間較長(zhǎng)，實(shí)時(shí)性差；基于網(wǎng)絡(luò)的方法又缺乏一定的可解釋性。論文“HerosNet: Hyperspectral Explicable Reconstruction and Optimal Sampling Deep Network for Snapshot Compressive Imaging”研究的內(nèi)容是可解釋深度神經(jīng)網(wǎng)絡(luò)在光譜壓縮感知上的應(yīng)用。課題組的研究表明，基于深度展開的方法能夠很好地利用兩種方法的優(yōu)勢(shì)，并有效解決現(xiàn)有深度展開方法中缺乏跨階段特征交互和自適應(yīng)參數(shù)調(diào)整的問(wèn)題。該研究結(jié)果所設(shè)計(jì)的深度展開網(wǎng)絡(luò)受優(yōu)化方法中的近鄰映射啟發(fā)，網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示，能夠聯(lián)合實(shí)現(xiàn)掩膜優(yōu)化和高光譜重建。該網(wǎng)絡(luò)通過(guò)引入動(dòng)態(tài)梯度下降模塊來(lái)模擬采樣矩陣，自適應(yīng)地更新迭代步長(zhǎng)；該網(wǎng)絡(luò)通過(guò)層級(jí)特征交互模塊，融合之前階段的特征用以重建當(dāng)前階段的圖像。論文通訊作者為張健助理教授，信息工程學(xué)院為第一作者單位，張軒宇同學(xué)為第一作者，合作者還包括香港中文大學(xué)孫啟霖助理教授、哈爾濱工業(yè)大學(xué)（深圳）張永兵教授和北京大學(xué)熊瑞勤教授。

　　自然圖像重建具有廣泛的應(yīng)用價(jià)值，可以顯著提升圖像或視頻的視覺質(zhì)量。現(xiàn)有圖像重建方法在性能和模型可解釋性上都存在一定的缺陷。論文“Deep Generalized Unfolding Networks for Image Restoration”針對(duì)現(xiàn)有的缺陷研究了可解釋性網(wǎng)絡(luò)在自然圖像重建上的應(yīng)用。研究表明，優(yōu)化啟發(fā)式的網(wǎng)絡(luò)設(shè)計(jì)在提升模型可解釋性的同時(shí)也可以提升模型性能。如圖3所示，論文設(shè)計(jì)的新型深度展開網(wǎng)絡(luò)由近端梯度下降算法（PGD）展開而成，每個(gè)階段的網(wǎng)絡(luò)結(jié)構(gòu)由數(shù)據(jù)模塊和先驗(yàn)?zāi)K交替堆疊而成，其中引入級(jí)間跳躍連接來(lái)個(gè)改進(jìn)傳統(tǒng)算法中存在的信息損失。通過(guò)可學(xué)習(xí)模塊替換傳統(tǒng)算子，所設(shè)計(jì)的模型具有良好的自適應(yīng)能力，同時(shí)保持了良好的可解釋性，在多個(gè)自然圖像重建任務(wù)中取得了領(lǐng)先性能。該工作由課題組獨(dú)立完成，論文通訊作者為張健助理教授，信息工程學(xué)院為第一作者單位，牟沖同學(xué)為第一作者，論文合作者還包括課題組的王茜同學(xué)。

　　以上三項(xiàng)研究成果得到了深圳市基礎(chǔ)研究專項(xiàng)以及國(guó)家自然科學(xué)基金的支持，在算力方面得到了深圳鵬城實(shí)驗(yàn)室的“鵬城云腦”支持。

評(píng)論

1點(diǎn)贊

報(bào)名申請(qǐng)

請(qǐng)?zhí)峁┮韵滦畔?，招生老師?huì)盡快與您聯(lián)系。符合報(bào)考條件者為您提供正式的報(bào)名表，我們承諾對(duì)您的個(gè)人信息嚴(yán)格保密。

姓名*

最高學(xué)歷/學(xué)位*

請(qǐng)選擇

大專以下大專本科有學(xué)位本科無(wú)學(xué)位碩士博士

手機(jī)*

畢業(yè)時(shí)間*

請(qǐng)選擇

2027年 2026年 2025年 2024年 2023年 2022年 2021年 2020年 2019年 2018年 2017年 2016年 2015年 2014年 2013年 2012年 2011年 2010年 2009年 2008年 2007年 2006年 2005年 2004年 2003年 2002年 2001年 2000年

所在地區(qū)*

省份