打破視角壁壘:創(chuàng)藝學(xué)院智造系統(tǒng)工程中心武穎娜課題組提出基于單應(yīng)性對(duì)齊的異常檢測(cè)創(chuàng)新框架VSAD

發(fā)布時(shí)間2026-02-04文章來(lái)源 創(chuàng)意與藝術(shù)學(xué)院作者責(zé)任編輯

當(dāng)前高端制造業(yè)全流程質(zhì)檢中,人工智能的落地應(yīng)用面臨場(chǎng)景復(fù)雜多變、異常種類(lèi)繁多且數(shù)據(jù)稀少、單視角易誤檢漏檢、以及功能異常識(shí)別困難等多重挑戰(zhàn)。針對(duì)這些行業(yè)共性難題,上??萍即髮W(xué)創(chuàng)意與藝術(shù)學(xué)院智造系統(tǒng)工程中心(CASE)武穎娜課題組致力于研發(fā)覆蓋制造全流程的異常識(shí)別算法與智能質(zhì)檢系統(tǒng)。

近日課題組聯(lián)合密歇根大學(xué)安娜堡分校研究團(tuán)隊(duì)在多視角異常檢測(cè)領(lǐng)域取得新突破。多視角成像技術(shù)是檢測(cè)復(fù)雜幾何結(jié)構(gòu)產(chǎn)品表面缺陷的主流方案,但現(xiàn)有方法常因缺乏跨視角的幾何一致性約束,導(dǎo)致不同視角下采集到的信息不完整。這種碎片化的單視角建模方法難以準(zhǔn)確定位缺陷。為攻克這一技術(shù)難題,研究人員提出了名為VSAD(View Sense Anomaly Detection)的創(chuàng)新性框架。該框架通過(guò)單應(yīng)性變換建立多視角圖像之間的幾何關(guān)系,有效避免了不同視角下的信息缺失,大幅提升模型對(duì)缺陷的識(shí)別定位能力與魯棒性。實(shí)驗(yàn)表明,VSAD在像素級(jí)、視角級(jí)與樣本級(jí)指標(biāo)上均優(yōu)于現(xiàn)有技術(shù),尤其在復(fù)雜紋理與強(qiáng)視角變化條件下,展現(xiàn)出更高的檢測(cè)穩(wěn)定性與精度。

 

1. VSAD模型架構(gòu)圖

 

相關(guān)研究成果以“Unsupervised Multi-View Visual Anomaly Detection via Progressive Homography-Guided Alignment”為題被第40屆AAAI人工智能?chē)?guó)際會(huì)議接收。上??萍即髮W(xué)2024級(jí)碩士研究生陳鑫濤為第一作者,2023級(jí)碩士研究生鄭博中與劉云為共同作者,論文由武穎娜研究員指導(dǎo)完成。上海科技大學(xué)為第一完成單位。

VSAD框架的提出基于課題組前期的系統(tǒng)性研究。此前,課題組首次構(gòu)建了面向工業(yè)應(yīng)用場(chǎng)景的多模態(tài)異常檢測(cè)數(shù)據(jù)集Phys-AD以及基于交互的視頻異常檢測(cè)數(shù)據(jù)集MulSen-AD,更進(jìn)一步提出了一系列創(chuàng)新方法,包括物理先驗(yàn)知識(shí)驅(qū)動(dòng)的異常檢測(cè)新范式、可拓展的三維異常生成及檢測(cè)網(wǎng)絡(luò)、決策級(jí)多傳感器融合算法、基于連續(xù)幾何表示的三維異常定位算法等。相關(guān)成果已在CVPR、ICCV等重要國(guó)際會(huì)議上發(fā)表。

 

2. 2024級(jí)碩士研究生陳鑫濤

 

Arxiv鏈接:https://arxiv.org/abs/2511.18766