国产精品久久久久影院,成人午夜福利视频,国产精品久久久久高潮,国产精品 欧美 亚洲 制服,国产精品白浆无码流出

新機(jī)器視覺(jué):更節(jié)能,也更具人性化

發(fā)布者:Yudie最新更新時(shí)間:2025-07-15 來(lái)源: 悅智網(wǎng) 手機(jī)看文章 掃描二維碼
隨時(shí)隨地手機(jī)看文章

圖片

Simone Reukauf


在過(guò)去十年中,人工智能視覺(jué)模型取得了顯著進(jìn)步。然而,這些進(jìn)步催生出的神經(jīng)網(wǎng)絡(luò)盡管效果顯著,卻與人類(lèi)視覺(jué)的諸多特征相去甚遠(yuǎn)。例如,卷積神經(jīng)網(wǎng)絡(luò)(CNN)往往更擅長(zhǎng)識(shí)別紋理,而人類(lèi)則對(duì)形狀的反應(yīng)更為強(qiáng)烈。


最近發(fā)表在《自然?人類(lèi)行為》雜志上的一篇論文在一定程度上填補(bǔ)了這一差距

https://www.nature.com/articles/s41562-025-02220-7。該論文介紹了一種新型的全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN),這種網(wǎng)絡(luò)在接受自然圖像訓(xùn)練后,形成了一種更接近人類(lèi)視覺(jué)的有序、專(zhuān)門(mén)化結(jié)構(gòu)。全拓?fù)渖窠?jīng)網(wǎng)絡(luò)能更好地模擬人類(lèi)的空間偏好 —— 比如會(huì)認(rèn)為飛機(jī)更可能出現(xiàn)在圖像的上方而非底部,并且與其他用于機(jī)器視覺(jué)的神經(jīng)網(wǎng)絡(luò)相比,其能耗顯著更低。


“當(dāng)你觀察大腦中知識(shí)的組織方式時(shí),會(huì)發(fā)現(xiàn)它與卷積神經(jīng)網(wǎng)絡(luò)等深度神經(jīng)網(wǎng)絡(luò)中的知識(shí)組織方式有著本質(zhì)區(qū)別,” 德國(guó)奧斯納布呂克認(rèn)知科學(xué)研究所教授、該論文的聯(lián)合指導(dǎo)者Tim C. Kietzmann說(shuō)道。

 

全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)能習(xí)得類(lèi)人的空間偏好 


如今大多數(shù)機(jī)器視覺(jué)系統(tǒng),包括谷歌相冊(cè)、Snapchat等應(yīng)用中使用的那些,都采用了某種形式的卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)會(huì)在多個(gè)空間位置重復(fù)使用相同的特征檢測(cè)器(這一機(jī)制被稱(chēng)為 “權(quán)重共享”)。其結(jié)果是,當(dāng)對(duì)網(wǎng)絡(luò)進(jìn)行映射時(shí),會(huì)呈現(xiàn)出緊密重復(fù)的分形圖案。


而全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的結(jié)構(gòu)則大不相同。它的結(jié)構(gòu)顯得更為平滑,相關(guān)神經(jīng)元會(huì)聚集形成簇群,但從不進(jìn)行復(fù)制。映射全拓?fù)渖窠?jīng)網(wǎng)絡(luò)空間關(guān)系的圖像,看起來(lái)就像丘陵地區(qū)的地形圖,或是顯微鏡下觀察到的一組微生物。


這種視覺(jué)上的差異絕非只是精美圖片之間的比較。Kietzmann表示,卷積神經(jīng)網(wǎng)絡(luò)所采用的權(quán)重共享機(jī)制與生物大腦存在根本性偏差。“大腦在某個(gè)位置學(xué)到信息后,無(wú)法將這些知識(shí)復(fù)制到其他位置,” 他解釋道,“但卷積神經(jīng)網(wǎng)絡(luò)卻能做到這一點(diǎn)。這是一種工程上的權(quán)宜之計(jì),目的是讓學(xué)習(xí)過(guò)程效率稍高一些?!?p>

全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)通過(guò)一種截然不同的架構(gòu)和訓(xùn)練方法,避開(kāi)了這一特性。


研究人員沒(méi)有采用權(quán)重共享機(jī)制,而是為網(wǎng)絡(luò)中的每個(gè)空間位置配備了獨(dú)立的可學(xué)習(xí)參數(shù)集。之后,為防止由此產(chǎn)生混亂無(wú)序的特征,他們?cè)谟?xùn)練過(guò)程中加入了 “平滑約束”,以此鼓勵(lì)相鄰神經(jīng)元學(xué)習(xí)相似(但絕不完全相同)的特征。


為了測(cè)試這種(結(jié)構(gòu)上的差異)是否能轉(zhuǎn)化為更接近人類(lèi)行為的機(jī)器視覺(jué),研究人員讓30名人類(lèi)參與者識(shí)別在屏幕不同位置短暫閃現(xiàn)的物體。結(jié)果顯示,盡管全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)仍不能完美模擬人類(lèi)視覺(jué),但它與人類(lèi)視覺(jué)的相關(guān)性是卷積神經(jīng)網(wǎng)絡(luò)的三倍。


該論文的合著者Zejin Lu表示,全拓?fù)渖窠?jīng)網(wǎng)絡(luò)與人類(lèi)視覺(jué)的相關(guān)性之所以更高,源于它學(xué)習(xí)空間關(guān)系的方式?!皩?duì)人類(lèi)來(lái)說(shuō),當(dāng)你識(shí)別某些物體時(shí),它們都有典型的位置。你知道鞋子通常在底部,在地面上;飛機(jī)則在頂部,” 他解釋道。

 

類(lèi)人行為不代表性能更優(yōu),但確實(shí)能降低能耗 


圖片

Simone Reukauf


全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)與人類(lèi)視覺(jué)更強(qiáng)的相關(guān)性,展示了機(jī)器可以被訓(xùn)練得更接近人類(lèi)的視物方式,但這并不一定意味著它在圖像分類(lèi)任務(wù)上表現(xiàn)更出色。


卷積神經(jīng)網(wǎng)絡(luò)在圖像分類(lèi)領(lǐng)域依舊占據(jù)優(yōu)勢(shì),準(zhǔn)確率達(dá)到43.2%。而全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的分類(lèi)準(zhǔn)確率在34.5%到36%之間,具體數(shù)值取決于網(wǎng)絡(luò)的配置。


不過(guò),它在準(zhǔn)確率上的不足,在效率上得到了彌補(bǔ)。全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)的能耗顯著低于接受測(cè)試的卷積神經(jīng)網(wǎng)絡(luò),后者在運(yùn)行過(guò)程中的能耗是它的十倍以上。值得注意的是,盡管全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的規(guī)模約為測(cè)試所用卷積神經(jīng)網(wǎng)絡(luò)的13倍(全拓?fù)渖窠?jīng)網(wǎng)絡(luò)約有1.07億個(gè)參數(shù),而卷積神經(jīng)網(wǎng)絡(luò)約有800萬(wàn)個(gè)參數(shù)),但仍實(shí)現(xiàn)了這一能耗優(yōu)勢(shì)。


全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的高效得益于其新穎的結(jié)構(gòu)。雖然整體規(guī)模更大,但該網(wǎng)絡(luò)能夠聚焦于圖像的最重要部分,而非對(duì)所有內(nèi)容進(jìn)行統(tǒng)一處理?!按嬖诖罅靠赡茏龀龇磻?yīng)的不同神經(jīng)元,但只有一部分會(huì)產(chǎn)生反應(yīng),” Kietzmann說(shuō)道。


全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)的高效性可能會(huì)對(duì)低功耗設(shè)備上的機(jī)器視覺(jué)產(chǎn)生影響。然而,Kietzmann和Zejin Lu強(qiáng)調(diào),能效并非他們的主要目標(biāo),也不是他們?cè)谡撐慕Y(jié)果中覺(jué)得更有意思的部分。相反,他們希望像全拓?fù)渖窠?jīng)網(wǎng)絡(luò)這樣的新型網(wǎng)絡(luò)架構(gòu),能為理解智能(無(wú)論是人工智能還是人類(lèi)智能)提供一個(gè)更完整的框架。


Kietzmann指出,追求規(guī)模似乎與已知的真實(shí)大腦(其可獲取的數(shù)據(jù)少得多,能耗也低得多)的發(fā)育方式不一致。那些試圖模擬類(lèi)人行為的網(wǎng)絡(luò),或許能為不惜一切代價(jià)追求規(guī)模(通過(guò)使用更多訓(xùn)練數(shù)據(jù)、訓(xùn)練參數(shù)更多的更大模型)提供一種替代方案。


“現(xiàn)在有一種趨勢(shì),但人們覺(jué)得,對(duì)于‘認(rèn)知是如何產(chǎn)生的’這一根本問(wèn)題,‘規(guī)模’只是一個(gè)太過(guò)乏味的答案,” Kietzmann說(shuō)。


引用地址:新機(jī)器視覺(jué):更節(jié)能,也更具人性化

上一篇:宇樹(shù)科技王興興發(fā)聲!回應(yīng)中美人形機(jī)器人差別
下一篇:最后一頁(yè)

小廣播
最新機(jī)器人文章

 
EEWorld訂閱號(hào)

 
EEWorld服務(wù)號(hào)

 
汽車(chē)開(kāi)發(fā)圈

 
機(jī)器人開(kāi)發(fā)圈

About Us 關(guān)于我們 客戶(hù)服務(wù) 聯(lián)系方式 器件索引 網(wǎng)站地圖 最新更新 手機(jī)版

站點(diǎn)相關(guān):

索引文件: 1 

詞云: 1 2 3 4 5 6 7 8 9 10

北京市海淀區(qū)中關(guān)村大街18號(hào)B座15層1530室 電話(huà):(010)82350740 郵編:100190

電子工程世界版權(quán)所有 京ICP證060456號(hào) 京ICP備10001474號(hào)-1 電信業(yè)務(wù)審批[2006]字第258號(hào)函 京公網(wǎng)安備 11010802033920號(hào) Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved