Clevrer 建立在 Clevr 基礎(chǔ)之上。Clevr 是斯坦福大學(xué) (Stanford University) 和 Facebook AI 研究團團隊 (Facebook AI Research) 于 2016 年發(fā)布的一組數(shù)據(jù)集,用來分析神經(jīng)網(wǎng)絡(luò)的視覺推理能力。該團隊成員包括大名鼎鼎的 ImageNet 創(chuàng)始人李飛飛 (Fei Fei Li) 博士。在國際表征學(xué)習(xí)會議 (ICLR) 上,Clevrer 的共同創(chuàng)作者例如來自麻省理工學(xué)院 -IBM 沃森實驗室 (MIT-IBM Watson Lab) 的莊根和來自 Deepmind 的普希梅特·科利 (Pushmeet Kohli) 等人對神經(jīng)符號概念 NS-DR (Neuro Symbolic Concept Learner,NS-DR),一種應(yīng)用于 Clevr 的神經(jīng)符號學(xué)模型做了介紹。
該論文寫道:“我們對視頻的時間和因果推理進行了系統(tǒng)性的研究。視頻的時間和因果推理這個問題非常深刻且具有挑戰(zhàn)性,它困擾研究人員很久了,但我們才剛剛開始用‘現(xiàn)代化的’ AI 工具來對它進行研究。”“我們新開發(fā)的 Clevrer 數(shù)據(jù)集和 NS-DR 模型即是朝這個研究方向進行的初步探索。”
Clevrer 數(shù)據(jù)集由 Bullet 物理模擬器制作,包括 2 萬部展示桌面上物體碰撞的合成視頻和一組自然語言數(shù)據(jù)集,其中包括與視頻內(nèi)物體相關(guān)的問題和答案??偣灿谐^ 30 萬個這樣的問題和答案,它們被分為描述性、解釋性、預(yù)測性和反事實性等類別。
麻省理工學(xué)院 -IBM 沃森實驗室負(fù)責(zé)人大衛(wèi)·考克斯 (David Cox) 在一次采訪中向 媒體透露,他堅信 Clevrer 數(shù)據(jù)集將有助于創(chuàng)造混合 AI,混合 AI 結(jié)合了神經(jīng)網(wǎng)絡(luò)和符號 AI??伎怂贡硎?,IBM 研究團隊 (IBM Research) 將把該方法應(yīng)用于 IT 基礎(chǔ)設(shè)施管理和工廠、建筑工地等工業(yè)環(huán)境。
考克斯稱:“我認(rèn)為這個數(shù)據(jù)集對幾乎所有類型的應(yīng)用都很重要。“通過該數(shù)據(jù)集,我們可以將世界簡單化為許多到處移動的球,這也正是觀察世界、了解世界、以及做計劃并改變世界的第一步。因此,我們認(rèn)為這個數(shù)據(jù)集的應(yīng)用或?qū)M跨多個領(lǐng)域,而視覺和機器人技術(shù)則是很好的開始?!?/p>
麻省理工學(xué)院 -IBM 沃森 AI 實驗室成立于三年前,旨在取得與廣義 AI 主題相關(guān)的顛覆性進展。該實驗室如 ObjectNet 等一些成果凸顯了 ImageNet 之類的深度學(xué)習(xí)成功案例相對薄弱,所以該實驗室已把重心轉(zhuǎn)向了神經(jīng)網(wǎng)絡(luò)和符號或經(jīng)典 AI 的結(jié)合上。
符號 AI 和神經(jīng)網(wǎng)絡(luò)一樣,已經(jīng)存在了幾十年之久??伎怂拐J(rèn)為,神經(jīng)網(wǎng)絡(luò)在等待著合適的條件出現(xiàn),如足夠多的數(shù)據(jù)和足夠多的計算符號,與此同時 AI 也在等待著神經(jīng)網(wǎng)絡(luò)的發(fā)展,以便再度復(fù)蘇。
考克斯說,這兩種 AI 的互補性很好,如果能夠結(jié)合,我們便可以用更少的數(shù)據(jù)和更高的效能來打造更穩(wěn)健和更可靠的模型。在年初與 VentureBeat 的一次訪談中,IBM 研究團隊負(fù)責(zé)人達里奧·吉爾 (Dario Gil) 稱神經(jīng)符號 AI 將成為 2020 年最重要的進展之一。
考克斯說,不論你想得到什么結(jié)果,通過神經(jīng)符號 AI,你都可以表征知識或程序,而不是像神經(jīng)網(wǎng)絡(luò)那樣映射輸入和輸出。因此,這或許能夠使 AI 更好地幫助我們解決現(xiàn)實世界的問題。
考克斯稱,“谷歌有一條數(shù)據(jù)之河,亞馬遜也有,這些都不是壞事,但我們絕大多數(shù)的問題更像是智力游戲,所以我們認(rèn)為,要向前發(fā)展,真正讓 AI 不再是概念上的炒作,我們需要建立能夠?qū)崿F(xiàn)這一點的系統(tǒng),這些系統(tǒng)有邏輯組件,可以能夠靈活地重新配置自己,可以根據(jù)環(huán)境和實驗采取行動,可以解釋這些信息,并擁有其認(rèn)知世界的內(nèi)在心理模型”。
麻省理工學(xué)院 -IBM 沃森 AI 聯(lián)合實驗室成立于 2017 年,總投資 2.4 億美元。
原文鏈接:
https://venturebeat.com/2020/04/28/mit-researchers-release-clevrer-to-advance-visual-reasoning-and-neurosymbolic-ai/
你也「在看」嗎???