近年來,日新月異的人工智能技術(shù)不斷推動著社會進步和產(chǎn)業(yè)變革,其中卷積神經(jīng)網(wǎng)絡(luò)(CNN)以其卓越的圖像識別能力,在人工智能技術(shù)領(lǐng)域,特別在ChatGPT中表現(xiàn)極為出色。近期,一項突破性的科研成果將卷積神經(jīng)網(wǎng)絡(luò)的概念引入光學領(lǐng)域,為人工智能成像技術(shù)帶來了革命性的進展。
由上海理工大學智能科技學院張啟明教授,智能科技學院、張江實驗室光計算所顧敏院士領(lǐng)銜的研究團隊,開發(fā)了一種超快速的卷積光學神經(jīng)網(wǎng)絡(luò)(ONN),這一技術(shù)在無需依賴光學記憶效應的情況下,實現(xiàn)了對散射介質(zhì)后的物體進行高效、清晰的成像。這不僅是對傳統(tǒng)光學成像技術(shù)的一次顛覆,更是卷積網(wǎng)絡(luò)在人工智能中應用潛力的一次深刻展示。該成果于6月14日以 “基于超快卷積光學神經(jīng)網(wǎng)絡(luò)的非記憶效應散射成像(Memory-less scattering imaging with ultrafast convolutional optical neural networks)”為題發(fā)表于《科學》(Science)子刊《科學進展》(Science Advances)上,智能科技學院張雨超特聘研究員為第一作者,顧敏院士和張啟明教授為共同通訊作者。
卷積神經(jīng)網(wǎng)絡(luò)作為目前為止應用最為廣泛的指一種人工智能神經(jīng)網(wǎng)絡(luò)架構(gòu),它由生物的視覺皮層系統(tǒng)發(fā)展而來,視覺皮層結(jié)構(gòu)由Hubel和Wiesel于1981年所提出,并獲得了諾貝爾獎。卷積操作作為卷積神經(jīng)網(wǎng)絡(luò)中的核心,通過提取圖像的局部特征并逐層構(gòu)建更為復雜和抽象的特征表示,極大地推動了圖像處理和模式識別領(lǐng)域的發(fā)展。然而,將這一概念應用于光學領(lǐng)域,面臨著將電子信號轉(zhuǎn)換為光學信號的挑戰(zhàn)。研究團隊巧妙地設(shè)計了一種全光學的解決方案,通過在光域中直接進行卷積網(wǎng)絡(luò)操作,省去了繁瑣的信號轉(zhuǎn)換過程,實現(xiàn)了真正的光速計算。
這項技術(shù)的關(guān)鍵在于構(gòu)建了一個多階段的卷積網(wǎng)絡(luò),它由多個并行核心組成,能夠以光速進行操作,直接從散射光中提取特征,實現(xiàn)圖像的快速重建。這一過程不僅極大地提高了成像速度,還顯著增強了成像質(zhì)量,使得在復雜散射環(huán)境中的成像成為可能。同時,卷積光學神經(jīng)網(wǎng)絡(luò)的計算速度達到了每秒1570萬億次操作(1.57 Peta operations per second, POPS),為實時動態(tài)成像提供了強大的支持。
此技術(shù)另一大亮點是其多任務處理能力。通過簡單地調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),同一卷積光學神經(jīng)網(wǎng)絡(luò)能夠同時執(zhí)行多種不同的圖像處理任務,如分類、重建等,在光學人工智能領(lǐng)域尚屬首次。張啟明教授提到:“這種靈活性和效率的結(jié)合,不僅展示了卷積網(wǎng)絡(luò)在人工智能中的重要性,也為光學成像技術(shù)開辟了新的道路?!?/p>
這項技術(shù)的問世,不僅是對卷積神經(jīng)網(wǎng)絡(luò)在光學領(lǐng)域的一次成功移植,更是對人工智能成像技術(shù)的一次重大推動。顧敏院士指出:“隨著技術(shù)的不斷發(fā)展和完善,我們有理由相信,卷積光學神經(jīng)網(wǎng)絡(luò)將在自動駕駛、機器人視覺、醫(yī)學成像等多個領(lǐng)域?qū)l(fā)揮更加重要的作用,為人類的生活帶來更多便利,為科學研究提供更強大的工具。這是卷積網(wǎng)絡(luò)的力量,也是人工智能的魅力?!?/p>

研究原理圖
論文鏈接:https://www.science.org/doi/10.1126/sciadv.adn2205
供稿:智能科技學院








