憑借在物理AI與開放環(huán)境圖文識別領(lǐng)域的重大技術(shù)突破與規(guī)?;涞貞?yīng)用,智慧互通(AICT)與北京科技大學(xué)、中國科學(xué)院自動化研究所等單位聯(lián)合申報的“面向開放環(huán)境的低質(zhì)圖像表征與復(fù)雜圖文識別技術(shù)及應(yīng)用”項目榮獲“2025中國電子學(xué)會科學(xué)技術(shù)獎”科技進(jìn)步獎一等獎。
該項目深度融合物理 AI領(lǐng)域技術(shù)創(chuàng)新,成功攻克了人工智能感知領(lǐng)域多項世界級難題,深度服務(wù)國家網(wǎng)絡(luò)信息安全、智能交通、智慧教育等重大戰(zhàn)略,產(chǎn)生了顯著社會與經(jīng)濟(jì)效益。

該項研究聚焦物理世界真實場景,以物理 AI 為核心底座,旨在解決開放環(huán)境自適應(yīng)感知與圖文識別中存在的低質(zhì)圖像表征難、開放模式分類差、神經(jīng)網(wǎng)絡(luò)計算慢”是其中公認(rèn)的技術(shù)難題。
由于噪聲復(fù)雜、類別開放、資源受限的特點,基于物理 AI的開放環(huán)境自適應(yīng)感知與圖文識別成為人工智能領(lǐng)域迫切需要解決的核心問題,是國際人工智能感認(rèn)知技術(shù)發(fā)展新的制高點,也是互聯(lián)網(wǎng)信息安全國家戰(zhàn)略需求和智慧教育、智能交通等國家重要行業(yè)智能化發(fā)展的共性關(guān)鍵技術(shù)。
針對這些難點,智慧互通(AICT)研發(fā)團(tuán)隊與其他項目組成員一起,基于物理 AI技術(shù)體系,共同提出了低質(zhì)圖像判別表征、開放模式語義建模、網(wǎng)絡(luò)模型高效計算等自適應(yīng)圖文識別關(guān)鍵技術(shù)。
關(guān)鍵創(chuàng)新:實現(xiàn)圖文識別領(lǐng)域三大技術(shù)突破
在各方團(tuán)隊共同努力下,項目物理 AI前沿技術(shù)實現(xiàn)了一系列技術(shù)創(chuàng)新:
在開放低質(zhì)數(shù)據(jù)自適應(yīng)的圖像特征判別表征方面,基于物理 AI感知機(jī)理,實現(xiàn)了開辟了噪聲圖文關(guān)系表征與提取的新技術(shù)路徑,實現(xiàn)了從“已知結(jié)構(gòu)提取”到“未知結(jié)構(gòu)表征”的范式變革,開放環(huán)境下無約束大規(guī)模車輛檢測精度達(dá) 96.85%,比國際最新技術(shù)(Meta)高15.85%。
在開放復(fù)雜模式自適應(yīng)的圖文類別語義建模方面,融合物理 AI開放場景理解能力,開創(chuàng)了開放集圖文識別技術(shù),實現(xiàn)了從“閉集模式分類”到“開放模式識別”的范式變革,開放集文字識別精度從原代表性方法(百度)35.40%躍升到89.52%。
在受限計算資源自適應(yīng)的圖文模型高效計算方面,結(jié)合物理 AI邊緣部署需求,開辟了深度神經(jīng)網(wǎng)絡(luò)聯(lián)合優(yōu)化壓縮的新技術(shù)路徑,在業(yè)內(nèi)率先設(shè)計了軟硬協(xié)同的高效圖文識別SoC芯片,獲2019年國際深度神經(jīng)網(wǎng)絡(luò)壓縮與加速競賽冠軍,綜合得分比美國高通公司技術(shù)高129.19%。
成果落地:賦能國家戰(zhàn)略與多行業(yè)規(guī)?;瘧?yīng)用
項目開創(chuàng)了物理 AI驅(qū)動的開放集圖文識別領(lǐng)域,構(gòu)建國家級重大應(yīng)用系統(tǒng),實現(xiàn)規(guī)模化落地,深度服務(wù)國家戰(zhàn)略與行業(yè)智能化升級:
支撐網(wǎng)絡(luò)信息內(nèi)容安全,建成國家級互聯(lián)網(wǎng)圖文識別與信息實時分析系統(tǒng)、國家廣電媒體圖文識別與內(nèi)容監(jiān)測系統(tǒng),開創(chuàng)了文字識別及智能識別技術(shù)國家級互聯(lián)網(wǎng)超大規(guī)模實際應(yīng)用的國內(nèi)先河。
助力重點場景與行業(yè)智能化,應(yīng)用于2022北京冬奧會張家口賽區(qū)車路感知與智慧交通、邊遠(yuǎn)少數(shù)民族地區(qū)中小學(xué)智慧教育等物理 AI典型落地場景。
產(chǎn)生顯著經(jīng)濟(jì)社會效益,近三年直接經(jīng)濟(jì)效益45.68億元、利潤18.32億元,在國家相關(guān)管理中心、北京冬奧會、騰訊等單位/場景廣泛應(yīng)用物理 AI圖文識別技術(shù),產(chǎn)生了重大的社會和經(jīng)濟(jì)效益。
責(zé)任編輯: 江曉蓓