Simone Reukauf
最近發(fā)表在《自然?人類(lèi)行為》雜志上的一篇論文在一定程度上填補(bǔ)了這一差距
https://www.nature.com/articles/s41562-025-02220-7。該論文介紹了一種新型的全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN),這種網(wǎng)絡(luò)在接受自然圖像訓(xùn)練后,形成了一種更接近人類(lèi)視覺(jué)的有序、專(zhuān)門(mén)化結(jié)構(gòu)。全拓?fù)渖窠?jīng)網(wǎng)絡(luò)能更好地模擬人類(lèi)的空間偏好 —— 比如會(huì)認(rèn)為飛機(jī)更可能出現(xiàn)在圖像的上方而非底部,并且與其他用于機(jī)器視覺(jué)的神經(jīng)網(wǎng)絡(luò)相比,其能耗顯著更低。
“當(dāng)你觀察大腦中知識(shí)的組織方式時(shí),會(huì)發(fā)現(xiàn)它與卷積神經(jīng)網(wǎng)絡(luò)等深度神經(jīng)網(wǎng)絡(luò)中的知識(shí)組織方式有著本質(zhì)區(qū)別,” 德國(guó)奧斯納布呂克認(rèn)知科學(xué)研究所教授、該論文的聯(lián)合指導(dǎo)者Tim C. Kietzmann說(shuō)道。
全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)能習(xí)得類(lèi)人的空間偏好
如今大多數(shù)機(jī)器視覺(jué)系統(tǒng),包括谷歌相冊(cè)、Snapchat等應(yīng)用中使用的那些,都采用了某種形式的卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)會(huì)在多個(gè)空間位置重復(fù)使用相同的特征檢測(cè)器(這一機(jī)制被稱(chēng)為 “權(quán)重共享”)。其結(jié)果是,當(dāng)對(duì)網(wǎng)絡(luò)進(jìn)行映射時(shí),會(huì)呈現(xiàn)出緊密重復(fù)的分形圖案。
而全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的結(jié)構(gòu)則大不相同。它的結(jié)構(gòu)顯得更為平滑,相關(guān)神經(jīng)元會(huì)聚集形成簇群,但從不進(jìn)行復(fù)制。映射全拓?fù)渖窠?jīng)網(wǎng)絡(luò)空間關(guān)系的圖像,看起來(lái)就像丘陵地區(qū)的地形圖,或是顯微鏡下觀察到的一組微生物。
這種視覺(jué)上的差異絕非只是精美圖片之間的比較。Kietzmann表示,卷積神經(jīng)網(wǎng)絡(luò)所采用的權(quán)重共享機(jī)制與生物大腦存在根本性偏差。“大腦在某個(gè)位置學(xué)到信息后,無(wú)法將這些知識(shí)復(fù)制到其他位置,” 他解釋道,“但卷積神經(jīng)網(wǎng)絡(luò)卻能做到這一點(diǎn)。這是一種工程上的權(quán)宜之計(jì),目的是讓學(xué)習(xí)過(guò)程效率稍高一些?!?p>
全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)通過(guò)一種截然不同的架構(gòu)和訓(xùn)練方法,避開(kāi)了這一特性。
研究人員沒(méi)有采用權(quán)重共享機(jī)制,而是為網(wǎng)絡(luò)中的每個(gè)空間位置配備了獨(dú)立的可學(xué)習(xí)參數(shù)集。之后,為防止由此產(chǎn)生混亂無(wú)序的特征,他們?cè)谟?xùn)練過(guò)程中加入了 “平滑約束”,以此鼓勵(lì)相鄰神經(jīng)元學(xué)習(xí)相似(但絕不完全相同)的特征。
為了測(cè)試這種(結(jié)構(gòu)上的差異)是否能轉(zhuǎn)化為更接近人類(lèi)行為的機(jī)器視覺(jué),研究人員讓30名人類(lèi)參與者識(shí)別在屏幕不同位置短暫閃現(xiàn)的物體。結(jié)果顯示,盡管全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)仍不能完美模擬人類(lèi)視覺(jué),但它與人類(lèi)視覺(jué)的相關(guān)性是卷積神經(jīng)網(wǎng)絡(luò)的三倍。
該論文的合著者Zejin Lu表示,全拓?fù)渖窠?jīng)網(wǎng)絡(luò)與人類(lèi)視覺(jué)的相關(guān)性之所以更高,源于它學(xué)習(xí)空間關(guān)系的方式?!皩?duì)人類(lèi)來(lái)說(shuō),當(dāng)你識(shí)別某些物體時(shí),它們都有典型的位置。你知道鞋子通常在底部,在地面上;飛機(jī)則在頂部,” 他解釋道。
類(lèi)人行為不代表性能更優(yōu),但確實(shí)能降低能耗
Simone Reukauf
全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)與人類(lèi)視覺(jué)更強(qiáng)的相關(guān)性,展示了機(jī)器可以被訓(xùn)練得更接近人類(lèi)的視物方式,但這并不一定意味著它在圖像分類(lèi)任務(wù)上表現(xiàn)更出色。
卷積神經(jīng)網(wǎng)絡(luò)在圖像分類(lèi)領(lǐng)域依舊占據(jù)優(yōu)勢(shì),準(zhǔn)確率達(dá)到43.2%。而全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的分類(lèi)準(zhǔn)確率在34.5%到36%之間,具體數(shù)值取決于網(wǎng)絡(luò)的配置。
不過(guò),它在準(zhǔn)確率上的不足,在效率上得到了彌補(bǔ)。全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)的能耗顯著低于接受測(cè)試的卷積神經(jīng)網(wǎng)絡(luò),后者在運(yùn)行過(guò)程中的能耗是它的十倍以上。值得注意的是,盡管全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的規(guī)模約為測(cè)試所用卷積神經(jīng)網(wǎng)絡(luò)的13倍(全拓?fù)渖窠?jīng)網(wǎng)絡(luò)約有1.07億個(gè)參數(shù),而卷積神經(jīng)網(wǎng)絡(luò)約有800萬(wàn)個(gè)參數(shù)),但仍實(shí)現(xiàn)了這一能耗優(yōu)勢(shì)。
全拓?fù)渖窠?jīng)網(wǎng)絡(luò)的高效得益于其新穎的結(jié)構(gòu)。雖然整體規(guī)模更大,但該網(wǎng)絡(luò)能夠聚焦于圖像的最重要部分,而非對(duì)所有內(nèi)容進(jìn)行統(tǒng)一處理?!按嬖诖罅靠赡茏龀龇磻?yīng)的不同神經(jīng)元,但只有一部分會(huì)產(chǎn)生反應(yīng),” Kietzmann說(shuō)道。
全拓?fù)渖窠?jīng)網(wǎng)絡(luò)(All-TNN)的高效性可能會(huì)對(duì)低功耗設(shè)備上的機(jī)器視覺(jué)產(chǎn)生影響。然而,Kietzmann和Zejin Lu強(qiáng)調(diào),能效并非他們的主要目標(biāo),也不是他們?cè)谡撐慕Y(jié)果中覺(jué)得更有意思的部分。相反,他們希望像全拓?fù)渖窠?jīng)網(wǎng)絡(luò)這樣的新型網(wǎng)絡(luò)架構(gòu),能為理解智能(無(wú)論是人工智能還是人類(lèi)智能)提供一個(gè)更完整的框架。
Kietzmann指出,追求規(guī)模似乎與已知的真實(shí)大腦(其可獲取的數(shù)據(jù)少得多,能耗也低得多)的發(fā)育方式不一致。那些試圖模擬類(lèi)人行為的網(wǎng)絡(luò),或許能為不惜一切代價(jià)追求規(guī)模(通過(guò)使用更多訓(xùn)練數(shù)據(jù)、訓(xùn)練參數(shù)更多的更大模型)提供一種替代方案。
“現(xiàn)在有一種趨勢(shì),但人們覺(jué)得,對(duì)于‘認(rèn)知是如何產(chǎn)生的’這一根本問(wèn)題,‘規(guī)模’只是一個(gè)太過(guò)乏味的答案,” Kietzmann說(shuō)。
上一篇:宇樹(shù)科技王興興發(fā)聲!回應(yīng)中美人形機(jī)器人差別
下一篇:最后一頁(yè)
- 熱門(mén)資源推薦
- 熱門(mén)放大器推薦
- 第一次俄軍向機(jī)器人部隊(duì)投降,AI和機(jī)器人主導(dǎo)戰(zhàn)場(chǎng)了嗎?
- 新機(jī)器視覺(jué):更節(jié)能,也更具人性化
- 宇樹(shù)科技王興興發(fā)聲!回應(yīng)中美人形機(jī)器人差別
- 康復(fù)機(jī)器人 融合腦機(jī)接口技術(shù) 人機(jī)交互更 無(wú)感
- 奇瑞人形機(jī)器人9月開(kāi)售并將面向個(gè)人用戶(hù),機(jī)器人時(shí)代該來(lái)了嗎?
- 規(guī)模化量產(chǎn)時(shí)代來(lái)臨?智元、宇樹(shù)科技中標(biāo)1.24億人形機(jī)器人大單!
- 奇瑞汽車(chē)公布陪伴機(jī)器人專(zhuān)利
- 高算力具身智能新腦力,工業(yè)機(jī)器人精準(zhǔn)作業(yè)達(dá)厘米級(jí)
- 英飛凌CYW55572:為地瓜機(jī)器人 RDK S100注入無(wú)線(xiàn)通訊動(dòng)力
- L6985F 38V、500mA 同步降壓開(kāi)關(guān)穩(wěn)壓器的典型應(yīng)用,具有 30 uA 靜態(tài)電流
- AM6TW-2405SZ 5V 6 瓦單路輸出 DC-DC 轉(zhuǎn)換器的典型應(yīng)用
- LTC4054L-4.2 的典型應(yīng)用 - ThinSOT 中的 150mA 獨(dú)立線(xiàn)性鋰離子電池充電器
- 采用MIC4575可調(diào)降壓穩(wěn)壓器的典型應(yīng)用電路
- 使用 TC7662B 電荷泵調(diào)節(jié)輸出電壓的典型應(yīng)用電路
- 使用 Asahi Kasei Microdevices Corporation 的 AK4220VQP 的參考設(shè)計(jì)
- CMC1003-2M??-55-8-KU、EP4CE55 USB Blaster 套件,允許在緊湊型模塊中實(shí)現(xiàn)通用邏輯功能、Altera Nios II 處理器操作
- LTC1046CS8 電池分路器的典型應(yīng)用電路
- ADP7118RD-EVALZ、LFCSP 評(píng)估板,用于評(píng)估 ADP7118 20V、200mA 低噪聲、CMOS LDO
- L7809C高輸入電壓電路典型應(yīng)用(配置1)
- 貿(mào)澤授權(quán)代理Texas Instruments 豐富多樣的產(chǎn)品
- 美國(guó)為何恢復(fù)英偉達(dá)H20對(duì)華銷(xiāo)售?白宮AI負(fù)責(zé)人回應(yīng)
- Cadence 率先推出業(yè)內(nèi)首款 LPDDR6/5X 14.4Gbps 內(nèi)存 IP,為新一代 AI 基礎(chǔ)架構(gòu)助力
- 手把手教你從零設(shè)計(jì)一款算力超過(guò) 1000Tops 的智能駕駛芯片
- OrangeBox汽車(chē)連接域控制器(CDC)開(kāi)發(fā)平臺(tái)
- 采用反激式轉(zhuǎn)換器進(jìn)行高功率應(yīng)用設(shè)計(jì)
- Vishay推出PLCC-6封裝RGB LED通過(guò)獨(dú)立控制紅色、綠色和藍(lán)色芯片實(shí)現(xiàn)寬色域
- 芯對(duì)話(huà) | CBMG719單刀雙擲模擬開(kāi)關(guān):高精度信號(hào)切換低阻高速寬溫
- 大聯(lián)大詮鼎集團(tuán)推出基于Qualcomm和Thundercomm產(chǎn)品的AI電子圍欄方案
- AMD:AI加速卡MI308將恢復(fù)出貨,許可證申請(qǐng)將被推進(jìn)至審核流程
- 為什么要把孩子的健康交給機(jī)器人?
- 99%的人并不知道國(guó)內(nèi)人臉監(jiān)控已經(jīng)達(dá)到什么水平
- 就因?yàn)橹肋@10點(diǎn) 買(mǎi)電視再也沒(méi)被騙過(guò)
- 對(duì)抗韓國(guó)!日本JOLED再獲470億投資
- 干貨:關(guān)于OLED燒屏 你必須知道的知識(shí)點(diǎn)
- 優(yōu)矽科技WH(渭河)系列RISC-V微架構(gòu)產(chǎn)品亮相了ELEXCON
- 專(zhuān)家:韓企向華為出口難獲美國(guó)許可,不可把禁令當(dāng)作暫時(shí)
- 華為汪嚴(yán)旻:華為手機(jī)在尚無(wú)GMS服務(wù)情況下已基本可用
- 三星顯示器申請(qǐng)?jiān)S可證 為向華為供貨
- 華為回應(yīng)芯片被美打壓:所有行業(yè)都該清醒了