DoNews4月27日消息(記者 翟繼茹)在GMIC北京2017大會上,科大訊飛研究院副院長王士進(jìn)發(fā)表了《以人工智能技術(shù)為基礎(chǔ)構(gòu)建商業(yè)新生態(tài)》的主題演講。王士進(jìn)認(rèn)為要做到人工智能+需要對各個(gè)行業(yè)進(jìn)行透徹的理解,并擁有大量的優(yōu)質(zhì)數(shù)據(jù)。
王士進(jìn)介紹第一代人機(jī)交互是以鍵盤和鼠標(biāo)為主,隨著移動(dòng)互聯(lián)網(wǎng)到來,觸控成為第二代人機(jī)交互方式。在物聯(lián)網(wǎng)時(shí)代,以智能語音為主,視覺、觸摸為輔的智能交互將很快走入我們的生活。
王士進(jìn)表示在基于新一代人機(jī)交互基礎(chǔ)上來構(gòu)建商業(yè)新生態(tài)方面,科大訊飛已經(jīng)在包括家居、醫(yī)療、安防、教育等場景下都做了布局。
人工智能+是近兩年非?;馃岬脑掝},王士進(jìn)認(rèn)為它包含了兩層意思,第一層是以語音、視覺為主的AI技術(shù)在萬物互聯(lián)的場景下面使人機(jī)交互效果更加優(yōu)異。第二個(gè)層面的意義是機(jī)器學(xué)習(xí)正在成為行業(yè)專家,這使得各領(lǐng)域都掀起了人工智能與行業(yè)結(jié)合的熱潮。(完)
以下為演講實(shí)錄:
大家好,因?yàn)閯偛胖鞒秩私榻B了,我不用介紹我們公司了,來自科大訊飛,談?wù)勆虡I(yè)新生態(tài)構(gòu)建,正好剛才我們有一個(gè)環(huán)節(jié)也討論了人工智能技術(shù)在很多商業(yè)里面怎么應(yīng)用,怎么去體現(xiàn)。
所以我今天PPT會分成兩個(gè)部分,第一個(gè)部分用非常短的時(shí)間把所謂的人工智能技術(shù)簡單過一遍。講到人工智能大家比較清楚,我們在1956年在美國會議上有幾位年輕的,當(dāng)然是非常有名的幾個(gè)專家提出人工智能技術(shù),所謂人工智能有很多不同的定義,但是在這些定義里面的話有一些大家的共識,這些共識包括我們認(rèn)為機(jī)器可以像人一樣感知、認(rèn)知,去決策和執(zhí)行,大家聽到很多嘉賓講的這些關(guān)于智能的一些相關(guān)工作,其實(shí)都涉及到這樣一些東西。所以我們可以把在自然宇宙中,人類智能和我們在數(shù)字宇宙中人工智能技術(shù)對應(yīng)起來。
關(guān)于人工智能分類的話,科大訊飛最早提出分類方式,第一是運(yùn)算技能,能存會算,第二包括感知和運(yùn)動(dòng)智能,希望機(jī)器像人一樣可以感知外面的世界。還有一個(gè)是認(rèn)知智能,是我們認(rèn)為人工智能比較高的境界,是讓我們機(jī)器可以理解會思考。
關(guān)于運(yùn)算智能,前面的人也講了很多,實(shí)際上大家可以看到關(guān)于在存儲和運(yùn)算上面,其實(shí)機(jī)器已經(jīng)把我們?nèi)祟悞佋诤竺媪?,無論α狗還是IBM那位先生提到很多計(jì)算,機(jī)器所實(shí)現(xiàn)的效果比人類好很多了。感知的話,大家提到很多,包括我們?nèi)祟惖穆犛X,包括人類的視覺,機(jī)器在很多方面進(jìn)步非??欤貏e是我們從2010年開始起深度學(xué)習(xí)提出來之后,機(jī)器感知的技能越來越快,甚至很多領(lǐng)域已經(jīng)達(dá)到和超過人類。
在第二段的話就是運(yùn)動(dòng)智能,也是一樣的,機(jī)器怎么能夠通過運(yùn)動(dòng)的判斷達(dá)到人的效果,比較有名在去年還是前年有機(jī)器人跟德國著名的乒乓球進(jìn)行比賽,雖然人類最后轉(zhuǎn)敗為勝,但是大家可以看到機(jī)器做了很多優(yōu)化的工作。
關(guān)于認(rèn)知智能我們說這是人類智能最高的體現(xiàn),這里面包含很多東西,對語言理解,對邏輯的推理,大家認(rèn)為是機(jī)器最大的挑戰(zhàn),同時(shí)這里面也是蘊(yùn)含了更多的商業(yè)機(jī)會。前面把人工智能技術(shù)過了一遍,下面談?wù)劶夹g(shù)和產(chǎn)業(yè)的融合,在談融合之前,我們簡單看人工智能的三次浪潮,時(shí)間有限,我不對每次浪潮做具體的解釋了,大家可以看到從現(xiàn)在開始,2000年開始,10年以后的話我們認(rèn)為核心技術(shù),跟這種產(chǎn)業(yè)形成的深度融合,很多嘉賓提到了大家都認(rèn)為現(xiàn)在是人工智能爆發(fā)非常好的時(shí)機(jī)。
訊飛在2014年的時(shí)候基于很多研究成果提出超腦,提出幾個(gè)主要的功能,我們希望訊飛超腦能聽會說,能理解,訊飛做云起家,云識別上,包括產(chǎn)業(yè)里面做了很多工作,最近我們在去年參加了由谷歌組織的比賽,因?yàn)榇蠹抑涝谧罱赗OT的時(shí)代,很多領(lǐng)域基于更困難的場景里面怎么使用多麥克風(fēng)促進(jìn)云識別的效果,這一直是產(chǎn)業(yè)里面最重要的問題,這也是以麥克風(fēng)陣列識別技術(shù)。相比于國內(nèi)和國際很多企業(yè),我們做了很多優(yōu)化,所以大家看效果也還不錯(cuò)。
第二個(gè)是讓機(jī)器會說,會說我們主要講機(jī)器合成,從06年開始參加國際語音合成的比賽,到16年已經(jīng)是11屆了,訊飛第一能夠連續(xù)蟬聯(lián)11屆的冠軍,第二是唯一一家能夠把自然度做上4分的單位,我們業(yè)內(nèi)評測5分滿分,4分我們認(rèn)為接近播音主持戰(zhàn)或者正常人的水平。特別隨著深度學(xué)習(xí)的發(fā)展,訊飛在去年年底的時(shí)候發(fā)布了一項(xiàng)新的合成技術(shù),使得我們這個(gè)合成技術(shù)只需要半個(gè)小時(shí)左右的錄音,任何一個(gè)說話人我們就可以達(dá)到合成,讓你從聽感上很難區(qū)分出機(jī)器還是人這樣一個(gè)效果。
關(guān)于讓機(jī)器能理解的話,訊飛提出超腦以后也做了很多工作,比如參加知識圖譜的構(gòu)建比賽,訊飛取得第一名的效果。我們?nèi)ツ赀€參加由美國舉行的一個(gè)比賽,我們認(rèn)為它是邏輯推理非常重要的比賽,大家認(rèn)為這是替代圖林測試非常有可能的。雖然說訊飛在里面比賽成績比較好,大家看到機(jī)器還有很多提升空間,比如人類在系統(tǒng)上可以做90分以上,當(dāng)時(shí)比賽可以做到60分,現(xiàn)在可以做到70多分。
最近在機(jī)器閱讀理解這個(gè)領(lǐng)域上面的話,國際上和國內(nèi)有非常多科研單位做類似的工作,訊飛也在競爭激烈中能夠持續(xù)保持這個(gè)技術(shù)的領(lǐng)先。剛才在實(shí)驗(yàn)室也提到,我們說衡量機(jī)器設(shè)備有沒有智能有一個(gè)辦法,其中一個(gè)參加考試,考試這塊原來在美國實(shí)驗(yàn)室做了一個(gè)美國生物考試,日本有一個(gè)東京大學(xué)的機(jī)器人,中國在15年的時(shí)候也提出由科技部發(fā)起,由科大訊飛主導(dǎo)首個(gè)中國人工智能的,我們是希望積極人可以像人一樣進(jìn)行語言的理解,聯(lián)想的推理,知識的表示和自主學(xué)習(xí),同時(shí)說的話讓機(jī)器人參加我們的高考,也能夠考上大學(xué),還希望是一本。
眾所周知,最近一兩年非常重要的話題,人工智能+,科大訊飛或者我,我認(rèn)為包含兩層意思,第一層我們認(rèn)為人工智能的技術(shù),特別是語音、視覺等使我們在萬物互聯(lián)的場景下面,使得我們機(jī)器和人進(jìn)行更好、更自然的交互,這是一個(gè)。
第二個(gè)深入到各個(gè)領(lǐng)域,機(jī)器可以學(xué)習(xí)到這些領(lǐng)域里面專家的知識,從而變成可預(yù)測、可決策這樣一些模型,從而達(dá)到接近領(lǐng)域?qū)<业乃?。同時(shí)大家看到各行各業(yè)都在掀起了人工智能和這些行業(yè)結(jié)合的工作。
下面我分別把這兩大塊做一些介紹。我們在早期的時(shí)候,第一代人和機(jī)器交互是以鍵盤和鼠標(biāo)為主,我們最早的時(shí)候小型機(jī)的時(shí)代,一直到個(gè)人PC的時(shí)代,主要通過鍵盤和鼠標(biāo)和機(jī)器交互,隨著我們說觸摸屏,互聯(lián)網(wǎng)時(shí)代到來的話,更多的時(shí)候,大家用跟手機(jī),跟平板做交流的時(shí)候的話,更多做多點(diǎn)觸控這種方式和機(jī)器做交流,隨著IOT時(shí)代到來的話,智能時(shí)代以語音為主,包括視覺,包括觸摸這些為輔這樣一種智能交互時(shí)代,我們認(rèn)為是第三代,而且會越來越快進(jìn)入到我們的生活。
在這里訊飛15年的時(shí)候提出AI、UI人工智能時(shí)代的這種人機(jī)交互解決方案,并且我們持續(xù)在為之優(yōu)化。主要解決這種人機(jī)交互里面的五個(gè)痛點(diǎn)問題,第一個(gè)原廠和降噪,很多語音識別距離話筒比較近或者噪聲很小的時(shí)候識別很好,但是出現(xiàn)距離遠(yuǎn)或者噪聲大比較難,智能家居有各種噪聲和回響怎么做好,這個(gè)很關(guān)鍵。第二個(gè)有些人有方言,或者方言味會比普通味還要重,這種場景下怎么做好,這是第二個(gè)痛點(diǎn)。第三個(gè)就是我們原來很多機(jī)器人人和機(jī)交互的話,術(shù)語說單攻,你說話的時(shí)候他要等,人和人交互不是這樣的,是一個(gè)非常自然的交互形式,所以我們也做了很多關(guān)于人機(jī)進(jìn)行雙攻交互的。
第四個(gè)我們知道語音識別是一個(gè)基于概率統(tǒng)計(jì)體系的,概率統(tǒng)計(jì)體系里面一定會有錯(cuò)誤產(chǎn)生,錯(cuò)誤對理解會造成困難,結(jié)合很多領(lǐng)域的知識把語音識別做識別結(jié)果的一些校正或者順滑,使得人機(jī)交互更流暢。還有多輪交互,變成以機(jī)器為中心變成以人為中心,就是機(jī)器面向人要解決的具體任務(wù),以任務(wù)為中心看機(jī)器怎么通過多次交流,使得達(dá)到人要完成的事情。
這個(gè)技術(shù)的話訊飛語音云已經(jīng)開放很長時(shí)間了,16年2月份左右上線的話,大家看到我們在一年左右時(shí)間因?yàn)檫@些技術(shù)和平臺以及解決方案的上線,使得用戶包括交互次數(shù)有些非常大的變化。
第二部分是講我們?nèi)斯ぶ悄芗夹g(shù)和各個(gè)行業(yè)結(jié)合,給各個(gè)行業(yè)帶來的變化,比如說剛才提到我們使用人工智能技術(shù)和我們這種交流的場景,比如大家可以看到在很多會議場景里面,原來會議場景有一個(gè)最重要的東西就是記者怎么整理成稿是一個(gè)很困難的事情,現(xiàn)在會非常容易,而且特別是我們在面向具體,我們是演講,面向會議的話,它可以識別出我們說話人的身份,使得在整理成稿的時(shí)候更加容易辨認(rèn)說話人。
第二個(gè),我們會發(fā)現(xiàn)在很多場景里面,交流的時(shí)候需要進(jìn)行語音的同傳,原來會有非常大的麻煩,不同的領(lǐng)域或者不同場景要請不同的同傳,因?yàn)橥瑐魅绻麑@個(gè)具體的領(lǐng)域不太熟悉的話翻譯出來的效果也不太好,所以基于機(jī)器翻譯的效果的話,基于交流的時(shí)候可以迅速去捕捉到大概的意思,去方便交流。
第二個(gè)的話基于移動(dòng)互聯(lián)網(wǎng)手機(jī)的應(yīng)用,包括跟移動(dòng)合作,提出靈犀這個(gè)品牌,定義人機(jī)交互智能助理,通過跟軟件的交互,都可以完成。第二個(gè)是訊飛語音輸入法,原來很多時(shí)候輸入有拼音,有手寫等很多輸入方式,但是很多場景里面現(xiàn)在用語音輸入發(fā)現(xiàn)很多人愿意使用,并且它的輸入速度相比以前用拼音或者用手寫有一個(gè)非常大的提升。
第三個(gè)我們說在智能家居里面使用的話,會使得交互非常容易。這一點(diǎn)訊飛在2015年左右發(fā)布智能家居的各種解決方案,包括音箱,還有和家電的合作,這是16年也是非常熱的話題,包括谷歌、蘋果、亞馬遜都發(fā)布了自己智能家居解決方案,這塊也是非常有意思的話題。
車載里面人機(jī)交互也是非常有意思的話題,手不能離開駕駛的時(shí)候使用語音交互是非常重要的方式,大家知道從另外一點(diǎn)上說,在車載環(huán)境里面的話,語音識別是非常困難的,因?yàn)樵肼晻韧ǔT肼晻y很多,訊飛在2015年和2016年連續(xù)參加由寶馬、奔馳、通用等公司語音技術(shù)評測,并且在評測里面都取得第一名的成績,將來我們陸續(xù)無論在國際車場還是國內(nèi)車場陸續(xù)包含這樣的車機(jī)會陸陸續(xù)續(xù)上線。
關(guān)于人工智能和各個(gè)行業(yè)結(jié)合的話,大家可以看到,首先懂得這個(gè)行業(yè),并且能夠獲得這個(gè)行業(yè)大的數(shù)據(jù),同時(shí)我們利用人工智能的核心算法,以及云平臺能力,使得能夠給這些行業(yè)進(jìn)行賦能。比如+教育,教育人最常見的難點(diǎn)和痛點(diǎn)是怎么根據(jù)學(xué)生去給他因材施教,因?yàn)槲覀冎涝谝粋€(gè)課堂里面,老師是沒有辦法對每個(gè)學(xué)生去個(gè)性化的學(xué)習(xí)和輔導(dǎo),這塊機(jī)器去對每個(gè)學(xué)生進(jìn)行畫像,根據(jù)智能算法對他進(jìn)行推薦和學(xué)習(xí),從而使得教育會有更深刻的變革。
人工智能和智慧城市的結(jié)合,包括剛才提到智能安防,包括社管云的服務(wù),我們在一個(gè)城市的合作里面的話,通過大數(shù)據(jù)+人工智能計(jì)劃的話,無論辦事效率還是辦事人員有一個(gè)非常大的變化。
剛才我看也提到智能醫(yī)療,我們也做了很多工作,包括我們說醫(yī)生在病例生成的時(shí)候用語音錄入病例,第二基于先進(jìn)的圖象識別技術(shù)做各種疾病的判別,特別癌癥一些病的判別,同時(shí)還在做輔助診療的技術(shù),基于病人的一些長期病例或者歷史去做各種輔助,同時(shí)我們應(yīng)該會參加今年的職業(yè)醫(yī)生水平的考試,醫(yī)考的機(jī)器人應(yīng)該是在七八月份上線,對病人怎么診斷,怎么醫(yī)療的話,可能要做跟多工作。
訊飛在很多行業(yè)里面也做了很多應(yīng)用,因?yàn)闀r(shí)間有限,我大概舉這樣一些例子是拋磚引玉,我們自己給自己定的是希望在中國用人工智能改變生活,改變世界。謝謝大家。