《連線》雜志網(wǎng)絡(luò)版今天撰文,披露了Facebook虛擬助理服務(wù)M誕生的幕后故事及工作機制。文章指出,為了開發(fā)這款產(chǎn)品,F(xiàn)acebook收購了語音識別技術(shù)公司W(wǎng)it.ai,網(wǎng)羅了像亞恩·勒庫恩(Yann LeCun)這樣的頂尖計算機人才,同時還運用最新的人工智能技術(shù)。在做好一切準(zhǔn)備之后,F(xiàn)aceboo最終打造出一款號稱比蘋果Siri等競爭對手更先進的智能產(chǎn)品。
Facebook推出虛擬助理服務(wù)M
老實說,Siri真的很差勁。通常情況下,它根本不知道你在說什么。即便真的知道,它提供的答案也不過是一個充斥著網(wǎng)絡(luò)鏈接的頁面。
這一問題的癥結(jié)在于,蘋果的語音助理是基于過時技術(shù)開發(fā)的。即使該公司用最新的人工智能技術(shù)對Siri進行升級,它的表現(xiàn)也遠遠不及有血有肉、又有神經(jīng)細胞的人類助理。雖然人工智能技術(shù)在過去幾年取得了很大進展,但距離真正的智能化還相當(dāng)遙遠。
新的虛擬助理服務(wù)“M”的推出,意味著Facebook在很大程度上也認同這種觀點。
M是基于該公司即時消息應(yīng)用Facebook Messenger開發(fā)的,在今天早上亮相,被推送到舊金山灣區(qū)數(shù)百名毫無心理準(zhǔn)備的用戶的手機上。這是Facebook為應(yīng)對Siri以及Google Now和微軟Cortana等類似產(chǎn)品而推出的一項服務(wù)。但是,它可以處理更廣泛的任務(wù)——至少Facebook是這樣說的。你可以問M各種各樣的問題,比如:“你能幫我預(yù)訂晚餐嗎?”、“你能幫我規(guī)劃我的下一個假期嗎?”它會一一執(zhí)行這些命令。
這是因為,F(xiàn)acebook設(shè)計了這一工具,以便讓人工智能技術(shù)與人類相配合,對這些問題做出回應(yīng)。Wit.ai創(chuàng)始人亞歷克斯·勒布倫(Alex Lebrun)說:“人工智能試圖做一切的事情,但人工智能是由人類控制的。”為了幫助開發(fā)這種智能手機工具,F(xiàn)acebook收購了Wit.ai。
在這個由人工智能驅(qū)動的私人助理的廣闊世界里,M似乎是Facebook回歸本源之舉。當(dāng)Facebook面向公眾測試M這個工具時,我們并不清楚這種人機合作能否跟上時代的步伐,覆蓋比以前任何時候都多的受眾。但若以一種違反直覺的方式來看,M可能是向真正的人工智能邁近了一步。
Facebook開發(fā)“M”背后的想法是,人類不僅會回答人工智能所不能回答的問題,而且從長遠來看,人類也會幫助改善人工智能技術(shù)。大家明白,當(dāng)前人工智能技術(shù)至少還需要人類幫助進行訓(xùn)練。如果你想要獲得一套系統(tǒng),希望可以在YouTube視頻中自動識別貓咪,人類必須首先將貓咪的樣子展示給這個系統(tǒng)看。
此外,人類必須給各種各樣貓咪的照片打標(biāo)簽,還必須提供相關(guān)數(shù)據(jù)。通過人類員工對M提供幫助,F(xiàn)acebook正以異常復(fù)雜的方式做著此類事情?!罢驗槿绱耍覀兘⒘艘恢绱她嫶蟮膱F隊,”勒布倫說?!拔覀冃枰臄?shù)據(jù)是不存在的?!痹诨卮鹉愕膯栴}時,這些人類員工將提供相關(guān)數(shù)據(jù),為一種更為復(fù)雜的數(shù)字助理提供幫助,而這種數(shù)字助理是基于一種稱為“深度學(xué)習(xí)”的人工智技術(shù)開發(fā)。
這一過程可能需要多年時間。但是,人工智能的發(fā)展方向就是這樣的。x.ai創(chuàng)始人兼CEO丹尼斯·莫滕森(Dennis Mortensen)說,“人類層面的人工智能是可以進行相當(dāng)高深的哲學(xué)討論。這種事情是不會很快發(fā)生的?!眡.ai是一家提供在線個人助理服務(wù)的創(chuàng)業(yè)公司,這種服務(wù)會自動為客戶安排會議時間。
頗具諷刺意味的是,Wit.ai提供的仍是相當(dāng)過時的人工智能技術(shù)。Wit.ai的技術(shù)基于兩種算法開發(fā),一是“條件隨機域”(conditional random fields),二是“最大熵分類器”(maximum entropy classifiers)。這兩種算法已經(jīng)為科技行業(yè)服務(wù)十多年了。不過,它們也為M項目尋找一種更先進的人工智能提供了一個跳板。
勒布倫在2013年創(chuàng)辦了Wit.ai,此前他開發(fā)了一種數(shù)字服務(wù),幫助AT&T等移動運營商用于與客戶溝通。Wit.ai基本上提供了一種可幫助軟件程序人員開發(fā)Siri式系統(tǒng)的服務(wù),這些系統(tǒng)可以識別語音,并在一定程度上理解自然語言。Wit.ai的服務(wù)的確是基于過時的算法所打造,但它可以逐漸學(xué)著識別語音,同時又不需要像蘋果和谷歌那樣,收集海量的語音數(shù)據(jù)。Wit.ai服務(wù)需要更少的數(shù)據(jù),而且只要整合了許多開發(fā)者搜集的語音樣本,就可以在實踐中使用。
負責(zé)Messenger業(yè)務(wù)的Facebook副總裁戴維·馬庫斯(David Marcus)曾想方設(shè)法將這項消息服務(wù)推向更多的領(lǐng)域,從而給Facebook做出營收貢獻。于是,馬庫斯找到了勒布倫和他的公司。今年1月份,F(xiàn)acebook收購了Wit.ai這家僅有10個人的創(chuàng)業(yè)公司,但具體的交易金額不詳。
馬庫斯表示,憑借這一交易,F(xiàn)acebook將“這個世界上最擅長人與人工智能交互的團隊之一”收入麾下。但據(jù)勒布倫透露,Wit.ai當(dāng)時并不清楚他們會參與開發(fā)什么樣的人與人工智能交互產(chǎn)品。大約3個月以后,馬庫斯、勒布倫及Wit.ai團隊的剩余人員最終敲定,基于Messenger開發(fā)一項虛擬助手服務(wù),但它不會是另一個“Siri”。
首先,這項服務(wù)主要是通過文字而非聲音溝通。其次,它會回答各種各樣更為復(fù)雜的問題。勒布倫表示:“如今,你已經(jīng)有了大量人工智能產(chǎn)品,如 Siri、谷歌Now和微軟Cortana,但它們的應(yīng)用范圍很有限。由于人工智能的這種限制,你只能在有限的場合使用。我們希望從一開始就能做更加雄心勃勃的事情,給人們他們真正想要的答案。”也就是說,這個團隊需要的不僅僅是人工智能。
當(dāng)你向M提出問題,這項人工智能技術(shù)會試著理解問題,并做出回答。但是,系統(tǒng)不會將答案發(fā)給用戶,而是先發(fā)給人類“培訓(xùn)師”——也就是類似客服的技術(shù)人員,他們與Wit.ai團隊一起工作,辦公地都在Facebook位于加州門洛帕克的新總部。這些培訓(xùn)人員會決定是否還需要做其他的工作,然后再向用戶提供他們正在尋找的答案。
據(jù)勒布倫介紹,M可以從事大量相對比較簡單的任務(wù),如講個笑話。M會對網(wǎng)絡(luò)段子API進行排序,如果它提供的段子很有趣,訓(xùn)練師就會批準(zhǔn)。至于相對更為復(fù)雜的任務(wù),如在機動車管理處(DMV)的網(wǎng)站上進行駕照考試預(yù)約,人類本身還要做大量繁重的工作。他們會給機動車管理處打電話確認信息。
在從事此類復(fù)雜的任務(wù)時,人類“培訓(xùn)師”會針對特殊問題的回答方式生成一個路線圖?!芭嘤?xùn)師所做的每一件事情,我們都會記錄下來,”勒布倫說道。這其中包括他們訪問的網(wǎng)站,他們在給機動車管理處打電話時說的話,以及回復(fù)M用戶信息時輸入的內(nèi)容等等。將來,這些數(shù)據(jù)將有助于開發(fā)一個基于深度學(xué)習(xí)的更先進的系統(tǒng),一種全新的人工智能技術(shù),可以通過分析一個巨大的機器網(wǎng)絡(luò)中的大量信息來操控很多任務(wù)?;旧?,這些網(wǎng)絡(luò)模擬了人類大腦中的神經(jīng)元網(wǎng)絡(luò)。
當(dāng)Facebook用戶提出問題時(最上面),M的人工智能引擎便會分析他說了什么(中間),然后把分析結(jié)果發(fā)給Facebook的人類“訓(xùn)練師”,后者再對用戶的問題作出回復(fù)(最下面)。
這些類似于神經(jīng)的網(wǎng)絡(luò)已證明它們在識別圖像、辨認語音、鎖定廣告,甚至教機器人擰開瓶蓋等方面是非常有效的。在聘請了紐約大學(xué)計算機科學(xué)研究人員亞恩·勒庫恩(Yann LeCun)之后,F(xiàn)acebook最終在這個重要性日益凸顯的領(lǐng)域確立了主導(dǎo)地位。該公司現(xiàn)在可以使用類似于神經(jīng)元的網(wǎng)絡(luò),識別貼到社交網(wǎng)絡(luò)上的照片信息,并能夠確定你在信息流(News Feed)中想看什么新聞。Facebook還計劃借助M的力量進一步推進這項技術(shù)的發(fā)展。
為什么不從一開始就用神經(jīng)網(wǎng)絡(luò)來打造M呢?如果沒有合適的數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)就不能提供比Siri更為強大的服務(wù),而Wit.ai的技術(shù)則可以在數(shù)據(jù)相對很少的情況下,打造更為強大的服務(wù)?!斑@是一個很好的引導(dǎo)方法。有了幾千個數(shù)據(jù)點之后,你就可以創(chuàng)建一個模型了,”勒布倫說道,“然后,通過這個模型,你又可以獲取更多的數(shù)據(jù)。你的數(shù)據(jù)點一旦達到100萬,就可以去找勒庫恩,就深度學(xué)習(xí)進行深入交流了?!?/p>
就像勒布倫所說的,這是一個雄心勃勃的計劃。他說,即使把多個神經(jīng)網(wǎng)絡(luò)融合起來,F(xiàn)acebook也要在接下來的幾年里繼續(xù)使用人類訓(xùn)練師。隨著M的不斷進步,它會需要更多的數(shù)據(jù)以繼續(xù)改善。“你知道的越多,發(fā)現(xiàn)自己不懂的也越多,”勒布倫說道。“M能做的越多,等它完成的復(fù)雜任務(wù)也越多?!?/p>
至少,這是Facebook的如意算盤。M今天剛剛發(fā)布,我們還不知道這項服務(wù)未來會如何。隨著Facebook把M介紹給越來越多的用戶,那么它需要的培訓(xùn)師也將越來越多。勒布倫預(yù)計,隨著用戶數(shù)量的不斷增加,培訓(xùn)師的數(shù)量也會直線上升,但由此帶來的壓力也會是巨大的。Facebook Messenger的用戶數(shù)量已經(jīng)超過7億?!斑@很不簡單了,”勒布倫說。
與此同時,即使Facebook能使這個系統(tǒng)不斷運行下去,M的發(fā)展也不可能像勒布倫和該公司預(yù)測的那樣快。莫滕森說,實際上,讓人類與人工智能攜手工作的話,可能會降低工作效率。
莫滕森還以自動駕駛汽車為例,解釋這種短板。開發(fā)自動駕駛汽車的一種方法是:在人類司機開車的過程中,慢慢加入自動化工具。但是,如果你讓車自己行駛的話,也許它的系統(tǒng)發(fā)展得會更快——無論它的裝備有多么差勁。對于最終成果來說,那些小型自動化工具可能不是最關(guān)鍵的。它們可能搜集的是你不需要的信息。
但同時,莫滕森也像勒布倫和Facebook一樣,強調(diào)了數(shù)據(jù)對于人工智能發(fā)展的重要性。他說,如果M項目進展順利的話——合適的引導(dǎo)、記錄以及對培訓(xùn)師的行為進行分類——這些人確實能夠提供一條捷徑。莫滕森說,F(xiàn)acebook必須關(guān)注人類在未來如何可以改善這一系統(tǒng),而不僅僅是現(xiàn)在。那不是一件容易的事情。不過,F(xiàn)acebook在這方面比大多數(shù)公司都做得好。(編譯/清辰)