近日,中國科學(xué)院合肥物質(zhì)院智能所智慧農(nóng)業(yè)研究中心王儒敬研究員團隊提出了一種可學(xué)習(xí)全頻變壓器雙生成對抗網(wǎng)絡(luò)方法,可顯著提升水下成像質(zhì)量。相關(guān)研究成果發(fā)表在海洋科學(xué)領(lǐng)域TOP期刊Frontiers in marine science上。
水下成像面臨著一系列嚴峻的挑戰(zhàn),如顏色失真、噪聲干擾和低對比度問題,這些問題極大地削弱了圖像的視覺質(zhì)量。為了攻克這些難題,科研團隊提出了一種創(chuàng)新的方法——可學(xué)習(xí)全頻變壓器雙生成對抗網(wǎng)絡(luò)(LFT-DGAN)。該方法首先引入了一種基于可逆卷積的圖像分解技術(shù),能夠?qū)⑺聢D像的信息精準(zhǔn)地分解為低頻、中頻和高頻域,有助于更全面地提取圖像特征;然后,利用圖像通道和空間之間的相似性,構(gòu)建了一個可學(xué)習(xí)的全頻域變壓器,促進不同信息分支之間的交流與融合;最后,開發(fā)了一種功能強大的雙域鑒別器,具備學(xué)習(xí)水下圖像空間特征的能力,能夠深入捕捉其頻域特征。
在UIEB數(shù)據(jù)集上,通過LFT-DGAN方法增強后的圖像質(zhì)量在PSNR、SSIM、UQIM、UCIQE指標(biāo)上比最先進算法(CWR、Semi-UIR、RCT等)分別平均提高4.3%、9.4%、21.6%、24.7%。
鄭世健博士生為論文第一作者,汪六三副研究員為論文通訊作者。該項研究工作得到了國家自然科學(xué)基金、國家重點研發(fā)計劃的支持。
論文鏈接為:https://www.frontiersin.org/articles/10.3389/fmars.2024.1321549/full
LFT-DGAN網(wǎng)絡(luò)的整體架構(gòu)
生成器框架
新聞鏈接:https://www.hf.cas.cn/kxyj/kyjz/202406/t20240606_7185303.html