近日,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦A類國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別頂級(jí)會(huì)議(CVPR)公布了錄用結(jié)果。內(nèi)蒙古大學(xué)“創(chuàng)新之家”成員,電子信息工程學(xué)院2022級(jí)本科生史佳鑫、向明月,2023級(jí)本科生黃逸軒,交通學(xué)院2022級(jí)本科生孫浩關(guān)于基于大模型的3D視覺(jué)定位研究成果(題為“Chain of Semantics Programming in 3D Gaussian Splatting Representation for 3D Vision Grounding”)被錄用。CVPR即IEEE國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議,是由IEEE舉辦的計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域的頂級(jí)會(huì)議,CCF推薦A類國(guó)際學(xué)術(shù)會(huì)議。根據(jù)會(huì)議官方統(tǒng)計(jì),本次CVPR 2025會(huì)議總投稿13008篇,錄用2878篇,錄用率僅為22.1%。
為了克服3D視覺(jué)定位任務(wù)中獲取細(xì)粒度語(yǔ)義信息和推理復(fù)雜空間關(guān)系難度大的問(wèn)題,該研究提出了一種零樣本神經(jīng)符號(hào)模型,通過(guò)語(yǔ)義鏈編程分解復(fù)雜空間關(guān)系,并利用3DGS表示提供細(xì)粒度語(yǔ)義。該研究在兩個(gè)公開(kāi)數(shù)據(jù)集上進(jìn)行評(píng)估。實(shí)驗(yàn)結(jié)果表明,該模型在Nr3D 數(shù)據(jù)集上精度達(dá)60.8%,接近最新的有監(jiān)督模型。在Sr3D 數(shù)據(jù)集上達(dá) 91.4%,優(yōu)于最新的有監(jiān)督模型。
在該研究工作中,我校是唯一完成單位,電子信息工程學(xué)院翁智教授為通訊作者。該研究工作得到國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(新工科重點(diǎn)領(lǐng)域支持項(xiàng)目,項(xiàng)目編號(hào):202410126042,指導(dǎo)教師:翁智)的支持。
(來(lái)源 : 電子信息工程學(xué)院 編輯:武濤 審核:劉雪峰 終審:阿茹娜)