“人工智能是先進(jìn)生產(chǎn)力,它正在以前所未有的深度、廣度和速度,進(jìn)入我們的生產(chǎn)和生活。它還不成熟,存在著固有的缺陷,存在著被濫用的可能,需要對(duì)它進(jìn)行治理,但這不能成為阻礙它發(fā)展的理由——對(duì)于人工智能,不發(fā)展就是最大的不安全?!敝袊乱淮斯ぶ悄馨l(fā)展戰(zhàn)略研究院執(zhí)行院長龔克在國家科技傳播中心講壇上發(fā)表如上觀點(diǎn)。
《國家科技傳播中心講壇》是中國科協(xié)打造的新型演講類新知欄目,以科學(xué)精神,科技探索和科技產(chǎn)業(yè)為主要講述內(nèi)容,匯集相關(guān)領(lǐng)域頂尖科技工作者講述科技創(chuàng)新故事,傳播前沿創(chuàng)新成果,弘揚(yáng)科學(xué)家精神。本文摘選部分內(nèi)容以饗讀者。
對(duì)人工智能可以有很多不同看法,我這里強(qiáng)調(diào)三點(diǎn)。第一,人工智能是一個(gè)不可抗拒的、加速發(fā)展的新質(zhì)生產(chǎn)力。第二,它正在經(jīng)歷著重大的技術(shù)突破——不是“經(jīng)歷了”,是“經(jīng)歷著”,它整個(gè)還處在重大的技術(shù)突破過程中。第三,它還不成熟,但是已經(jīng)在用了,而且是越用越廣,它的風(fēng)險(xiǎn)需要被控制。
人工智能是一項(xiàng)技術(shù),是一項(xiàng)要完成人類規(guī)定的,或者人類所需要的任務(wù)的技術(shù)。它通過什么辦法來完成?通過模仿人類的智能行為。人類智能行為需要分成四個(gè)步驟來完成:首先是感知,在感知基礎(chǔ)上有認(rèn)知,認(rèn)知之后叫謀行,即謀劃行動(dòng),最后是執(zhí)行。
ChatGPT開創(chuàng)了人工智能發(fā)展的新階段
人工智能發(fā)展已經(jīng)有70多年歷史了。過程中有幾個(gè)重要的節(jié)點(diǎn),其中最重要的是1956年,在美國達(dá)特茅斯舉行了一次會(huì)議,一群年輕人在當(dāng)年夏季的研討會(huì)中提出了人工智能的概念。這群人中歲數(shù)最大的一位是Claude Shannon,他是信息論的創(chuàng)始人,當(dāng)時(shí)他已經(jīng)是MIT正教授,也不過才39歲。
進(jìn)入新世紀(jì),華裔科學(xué)家李飛飛建立了一個(gè)有1500多萬張標(biāo)注好的圖片的巨大數(shù)據(jù)庫,全世界搞圖像識(shí)別的人可以用這個(gè)數(shù)據(jù)庫對(duì)AI進(jìn)行訓(xùn)練,然后進(jìn)行識(shí)別。最初這個(gè)比賽表現(xiàn)最好的五個(gè)團(tuán)隊(duì),平均錯(cuò)誤率達(dá)到28%,然后逐年下降。作為對(duì)比,人類識(shí)別的誤差率在5%-10%之間。到了2012年 、2013年的時(shí)候,AI就逼近了人類的水平。
這個(gè)進(jìn)步,科學(xué)家依賴的是一種叫做深度神經(jīng)網(wǎng)絡(luò)的算法。從那以后,所有最好的團(tuán)隊(duì)都用深度神經(jīng)網(wǎng)絡(luò),很快就突破了人類界限,錯(cuò)誤率直逼3%以下。這一巨大的成功使得圖像識(shí)別變成了第一項(xiàng)成熟的人工智能應(yīng)用,人工智能從論文和實(shí)驗(yàn)室走到了我們的生產(chǎn)和生活之中。
2022年11月30日發(fā)生了一件事情,OpenAI宣布他們的一個(gè)產(chǎn)品誕生,這個(gè)產(chǎn)品叫ChatGPT,我們現(xiàn)在把它稱為生成式的人工智能。它可以模仿人類生成文本、劇本、圖像、視頻,以及程序的代碼。這是一個(gè)重要的進(jìn)步,我們認(rèn)為它開創(chuàng)了人工智能發(fā)展的新階段。
從技術(shù)上看,這個(gè)新階段是由于有巨大參數(shù)的大模型同一系列其他技術(shù)相結(jié)合,實(shí)現(xiàn)了對(duì)語意的基本掌握。我們知道,所有的人類語言中用了很多詞匯,但是同一個(gè)詞匯在不同的上下文之間,可以表達(dá)不同的語意。這個(gè)大訓(xùn)練模型利用了很長的文本,使得每一個(gè)詞的語意得到相對(duì)比較準(zhǔn)確的表達(dá)。
從應(yīng)用上看,chat也是非常重要的。在這之前比較有名的AI有Deep Blue(深藍(lán)),是下國際象棋的。后來出現(xiàn)下圍棋的AlphaGo。在中國,下國際象棋的人不多,下圍棋的可能多一點(diǎn),但依然不是所有人都下圍棋?,F(xiàn)在到了chat,everyone chats,所有人都會(huì)聊天,通過聊天把人工智能推向了所有的人。我想這是在應(yīng)用上一個(gè)重大的進(jìn)步。
但這也引起了社會(huì)上的一些焦慮,擔(dān)心AI會(huì)不會(huì)最后超過我們?nèi)祟?、它和人類是什么關(guān)系、人類能不能有效地管控它、它會(huì)不會(huì)終結(jié)我們?nèi)祟悺T谶@種情況下,去年3月份,包括Elon Musk在內(nèi)的一批名人,就發(fā)出一個(gè)呼吁,說是要把人工智能的發(fā)展先停下來,至少停6個(gè)月。
但事實(shí)上它并沒有停下來。2023年6月份,麥肯錫做了一個(gè)調(diào)查,發(fā)現(xiàn)在亞太和北美地區(qū),有40%的人在工作或生活中常規(guī)性地在使用AI;在技術(shù)領(lǐng)域和傳媒領(lǐng)域,甚至有50%的人在使用生成式AI——那時(shí)離ChatGPT出現(xiàn)只有半年的時(shí)間。這說明人工智能已經(jīng)實(shí)實(shí)在在地走進(jìn)了我們的生產(chǎn)和生活,這是一個(gè)擋不住的、重要的、歷史性的趨勢(shì)。
根據(jù)預(yù)測(cè),從2023年到2030年,人工智能將以36.8%的速度在市場(chǎng)發(fā)展。我不知道還有什么其他的行業(yè)可以被預(yù)測(cè)有這么高的發(fā)展速度。
自古以來,人類從茹毛飲血到男耕女織,一直到今天的超級(jí)計(jì)算,人類總是不斷創(chuàng)造出工具來增強(qiáng)我們的能力,增強(qiáng)我們的體力,增強(qiáng)我們的腦力。這是人與其他動(dòng)物的重要區(qū)別之一。自有文明史以來5000多年,人類在生理上并沒有什么重大的變化,但是今天人類的能力,比5000年前要強(qiáng)得多。強(qiáng)在什么地方?不是我們的腦比那時(shí)候更發(fā)達(dá)了,或者是我們的骨骼比那時(shí)候更發(fā)達(dá)了,而是我們使用的工具比那時(shí)候更先進(jìn)了。這個(gè)過程就是生產(chǎn)力的進(jìn)步。
大模型如何形成智能?
人工智能就像機(jī)械動(dòng)力技術(shù)、電氣技術(shù)那樣,是革命性的通用技術(shù),在所有的行業(yè)都能用,它會(huì)帶來整個(gè)社會(huì)的智能化。如何實(shí)現(xiàn)這樣的技術(shù)突破?這需要一個(gè)從量變到質(zhì)變的過程。2018年剛推出來的第一代GPT,只有10億的參數(shù),到2019年達(dá)到了15億的參數(shù),有所增長;到了2020年6月份,達(dá)到了1750億的參數(shù),這個(gè)增長已經(jīng)不是一般的量變,可以稱之為突變了?,F(xiàn)在參數(shù)又有了數(shù)百倍的增長,更是達(dá)到了幾十萬億。這種量的變化給AI帶來了巨大的能量。
這個(gè)參數(shù)是什么意思?指的是我們模仿人腦創(chuàng)造一個(gè)神經(jīng)網(wǎng)絡(luò)的模型,模型中連接點(diǎn)的數(shù)量。人腦有860億個(gè)神經(jīng)元,這些神經(jīng)元通過觸突連接起來,我們模仿它,所謂模型參數(shù)就是這種連接的數(shù)量。但模型參數(shù)是不是越大越好、把參數(shù)做到無限大的時(shí)候AI就能變得無限聰明?也不盡然。非洲大象的神經(jīng)元數(shù)量比人還大至少三倍,但是它并不比人聰明。這告訴我們,簡單地去增加參數(shù)數(shù)量并不能達(dá)到更好的智能效果。所以我們一方面要增加參數(shù),另外一方面還需要技術(shù)的黃金組合。
ChatGPT一系列的技術(shù)里面,有幾項(xiàng)特別值得一提的技術(shù),其中一項(xiàng)叫 Word Embedding ,翻譯成中文叫詞嵌入。這是比較難懂的一個(gè)詞,是把一個(gè)詞嵌入到一個(gè)矢量的空間里面。這里面矢量的維數(shù)可以非常多,每一維以0或者1代表一個(gè)矢量的性質(zhì)。比方說第一個(gè)維度以0和1代表它是個(gè)生物還是非生物;如果是生物,下一維度,這是動(dòng)物還是植物;如果是動(dòng)物,下一維度判斷這是哺乳動(dòng)物還是非哺乳動(dòng)物;如果是哺乳動(dòng)物,是地上跑的還是天上飛的……在一個(gè)高維矢量空間里,把一個(gè)詞意給它確定下來,這就叫做 Word Embedding。
還有一項(xiàng)重要的技術(shù),GPT的T是Transformer的首字母。Transformer我們翻譯成變換器。這個(gè)變換器是干什么的?是做編碼和解碼用的。編碼和解碼會(huì)產(chǎn)生另一個(gè)概念,我們叫做 attention,翻譯成注意力,它可以在很長的上下文中找到關(guān)鍵詞。人看文章的時(shí)候,不是在每一個(gè)詞上都平均用力的,而是迅速抓住關(guān)鍵詞,這對(duì)AI來說也是一個(gè)重要的功能。
接下來還有一個(gè)重要的功能,叫做基于人類反饋的強(qiáng)化學(xué)習(xí)。就是AI說錯(cuò)了以后,我們告訴它:“你說得不對(duì)吧?你寫得太長,要壓縮?!痹谶@個(gè)人類反饋過程中,可以把人的價(jià)值觀、社會(huì)的風(fēng)俗、法律的規(guī)定、技術(shù)的標(biāo)準(zhǔn)、人的審美和情緒,用語言輸入給模型,讓它產(chǎn)生你所需要的結(jié)果。
這一系列重要技術(shù)組合,才產(chǎn)生了今天的技術(shù)突破,而且按照我的說法,它正在經(jīng)歷著突破,還在往前走著。
大模型帶來一個(gè)非常重要的工作模式和很多新的崗位。這個(gè)新的工作模式叫做MaaS,Model as a Service。原來我們說軟件是個(gè)服務(wù),網(wǎng)絡(luò)是個(gè)服務(wù),平臺(tái)是個(gè)服務(wù),現(xiàn)在說,模型是個(gè)服務(wù)。這個(gè)預(yù)訓(xùn)練的大模型會(huì)變成一個(gè)社會(huì)的基礎(chǔ)設(shè)施,讓我們的各行各業(yè)在這個(gè)預(yù)訓(xùn)練大模型基礎(chǔ)上,用我們的數(shù)據(jù)和專門的知識(shí),結(jié)合我們特定的任務(wù),把它變成一個(gè)專用的模型。
這時(shí)候就降低了我們使用模型的門檻。即便要改進(jìn)模型,也不用從頭做起,我們可以拿過一個(gè)大模型來,結(jié)合我們需要用的專門的數(shù)據(jù)做精調(diào)?,F(xiàn)在有招聘一種崗位,叫做提示工程師。提示工程師的主要工作就是跟AI對(duì)話,通過有效對(duì)話來對(duì)它進(jìn)行訓(xùn)練。GPT工程師可以在模型基礎(chǔ)上去改錯(cuò)、加工,而不是從頭一行一行寫C語言代碼,這使得原來最低級(jí)的程序員變成了軟件系列里比較高級(jí)的系統(tǒng)分析師。如果我們把AI看成是一輛車,我們不僅需要設(shè)計(jì)車的人和造車的人,更需要會(huì)開車的人。這就是一旦普遍使用這個(gè)工具,就會(huì)產(chǎn)生各行各業(yè)新的工作崗位的原因。
但人工智能的應(yīng)用也是有風(fēng)險(xiǎn)的。它存在風(fēng)險(xiǎn)的一個(gè)最根本的原因在于,它在推測(cè)答案的時(shí)候,用的是概率,叫做聯(lián)合分布概率。給它輸入一個(gè)問題,它判斷哪些詞與輸入的詞組合形成的概率最高,那就是它選擇的輸出。既然它是通過概率來判斷的,就不可能100%正確,總有出錯(cuò)的時(shí)候。人也會(huì)出錯(cuò),只不過我們可以通過長期的實(shí)踐、根據(jù)民主決策的程序、通過專家咨詢等,來盡量減少人的錯(cuò)誤。而對(duì)大模型,現(xiàn)在還存在不可解釋性,還不能清晰地說明在什么樣的條件下可以影響它的概率分布。
我們認(rèn)為這種出錯(cuò)基本上會(huì)來自兩個(gè)方面:一是技術(shù)內(nèi)在的不完善,聯(lián)合分布概率因此不可完全控制;另外一方面來自于它的濫用——再安全的車,也可以開著去撞人,不是車不好,也不是車的技術(shù)參數(shù)不好,危險(xiǎn)來自對(duì)它的濫用。
發(fā)展人工智能我們可以這樣干
以上內(nèi)容可以歸結(jié)為三點(diǎn):第一,人工智能是先進(jìn)生產(chǎn)力,發(fā)展不可阻擋;第二,它正在形成大的突破,而且是以前所未有的深度、廣度和速度,在進(jìn)入我們的生產(chǎn)和生活;第三,它還不成熟,存在著固有的缺陷,存在著被濫用的可能,需要對(duì)它進(jìn)行治理。在這三點(diǎn)基礎(chǔ)上,我們可以討論如何發(fā)展AI。
這里我想談五個(gè)關(guān)鍵詞:創(chuàng)新、應(yīng)用、平臺(tái)、治理、人才。
創(chuàng)新和應(yīng)用是一個(gè)相互迭代的過程,是相互促進(jìn)的,沒有創(chuàng)新就沒有有效的應(yīng)用。在此我借用一下“深度學(xué)習(xí)”中的“深度”概念,提出深度的創(chuàng)新和深度的應(yīng)用。深度創(chuàng)新,指的是要在根上創(chuàng)新,要突破模型可解釋性問題,我們不能總是把別人做的模型拿過來做fine tuning。我們有沒有可能在類腦神經(jīng)模型上做新的突破?就是把前文說的MaaS這個(gè)模型作為一個(gè)服務(wù)給廣泛推出,在應(yīng)用大模型基礎(chǔ)上,把人工智能從chat推向product,變成了product以后,才能真正發(fā)揮效益。
這里我給大家舉一個(gè)例子?,F(xiàn)在一些頭部的企業(yè)已經(jīng)在推出面向行業(yè)的應(yīng)用,但這些應(yīng)用需要跟行業(yè)更緊密地結(jié)合,把它真正落到生產(chǎn)的深部。我們研究院做了一個(gè)試驗(yàn),到全國開展自動(dòng)駕駛網(wǎng)聯(lián)車的那些城市去發(fā)調(diào)查問卷,分成坐過網(wǎng)聯(lián)車的和沒坐過網(wǎng)聯(lián)車的。我們看到無論是試驗(yàn)組還是對(duì)照組對(duì)自動(dòng)駕駛汽車上路進(jìn)行測(cè)試,都持積極的態(tài)度,其中坐過的(試驗(yàn)組)態(tài)度更為積極。拿武漢舉例,自動(dòng)駕駛出租車推出商業(yè)服務(wù)不到500天的時(shí)間,有一個(gè)人就用了900多次,差不多一天用兩次自動(dòng)駕駛車接送他的孩子。這說明這項(xiàng)技術(shù)在中國有比較好的接受度,我們可以在大規(guī)模應(yīng)用過程中完善技術(shù)。
創(chuàng)新和應(yīng)用之外,我們發(fā)現(xiàn)了一個(gè)更重要的現(xiàn)象:創(chuàng)新和應(yīng)用在中國的發(fā)展是由平臺(tái)支撐的。我們調(diào)查了全國的2205家人工智能企業(yè),看這些人工智能企業(yè)的資金從哪里來,投資向哪里去;看他們的人才從哪里來、人才跳槽向哪里去;看他們的技術(shù)從哪里來,如果輸出技術(shù)向哪里去。人、才、技術(shù)形成了這些企業(yè)之間的相互聯(lián)系。
在這兩千多家企業(yè)的背后,我們發(fā)現(xiàn)了一大批投資者、一大批科研院所、一大批政府的科研園區(qū)等。其中有15家企業(yè)是科技部命名的,叫人工智能開放創(chuàng)新平臺(tái)。這15個(gè)開放創(chuàng)新品牌,在這兩千多家企業(yè)中起到了重要的推動(dòng)作用。這是一個(gè)平臺(tái)推動(dòng)的發(fā)展生態(tài)。
我們需要建立一批跨界的創(chuàng)新組織,用這些創(chuàng)新組織來探索這種由平臺(tái)驅(qū)動(dòng)的新質(zhì)生產(chǎn)力,形成更好的上層建筑(生產(chǎn)關(guān)系),來加快創(chuàng)新應(yīng)用的循環(huán),推動(dòng)產(chǎn)業(yè)的新生態(tài),實(shí)現(xiàn)人工智能和實(shí)體經(jīng)濟(jì)的深度融合。這是寫進(jìn)我們黨的十九大報(bào)告的一句話:推進(jìn)人工智能和實(shí)體經(jīng)濟(jì)深度融合。
還有一個(gè)關(guān)鍵詞是治理。在這里,治理的對(duì)象是一種生產(chǎn)力,而且是一種先進(jìn)的生產(chǎn)力,我們要以是否能解放和發(fā)展這種生產(chǎn)力作為治理的標(biāo)準(zhǔn)。最忌諱的,就是用現(xiàn)存的生產(chǎn)關(guān)系來約束正在迅速發(fā)展的先進(jìn)的新質(zhì)生產(chǎn)力。切記不能把這一生產(chǎn)力的發(fā)展和它的安全給對(duì)立起來——不發(fā)展就是最大的不安全,我們要治理它,首先就要把它發(fā)展好,要發(fā)展好就要鼓勵(lì)從根上創(chuàng)新,沒有根上的創(chuàng)新就沒有根上的安全,就實(shí)現(xiàn)不了發(fā)展。
目前我們國家建立了基于風(fēng)險(xiǎn)的、對(duì)人工智能的治理機(jī)制,劃出了一些高風(fēng)險(xiǎn)應(yīng)用。比如把腦機(jī)接口植入到人的大腦里,風(fēng)險(xiǎn)就比較高,這樣的應(yīng)用就屬于高風(fēng)險(xiǎn)應(yīng)用。
智能化社會(huì)來了,我們需要全民的人工智能素質(zhì),但是不需要社會(huì)焦慮?,F(xiàn)在有些完全不必要的社會(huì)焦慮,它們的存在只會(huì)對(duì)人工智能的發(fā)展、對(duì)生產(chǎn)生活的高質(zhì)量發(fā)展帶來毫無必要的干擾。
最后一個(gè)關(guān)鍵詞是人才。有人評(píng)估說,光是中國人工智能領(lǐng)域,相關(guān)崗位就缺500萬,現(xiàn)在我們就要把這500萬人給培養(yǎng)出來。但還不止于這500萬,我們整個(gè)已經(jīng)進(jìn)入人工智能時(shí)代,這個(gè)時(shí)代所有合格公民都應(yīng)該具備人工智能相應(yīng)的素質(zhì),能夠?qū)W會(huì)駕馭人工智能。這就需要對(duì)我們的教育系統(tǒng)提出新的要求。
應(yīng)用人工智能,特別要注意的是我們可以駕馭而不可以依賴這個(gè)工具——必須清楚,AI生成的只是半成品,它要經(jīng)過人類的審視、人類的加工,才能變成一個(gè)真正的成品。我們要對(duì)它做factual check、logic check、ethical check,也就是做事實(shí)的、邏輯的、倫理的審查。這里有個(gè)詞叫做critical thinking,翻譯成批判性思維,其實(shí)我覺得翻譯成審辯思維更好。
概括起來,我們現(xiàn)在需要為AI立心。聯(lián)合國有一個(gè)口號(hào),The AI we want is the AI with human values for sustainable development,“我們需要具有人類價(jià)值觀的、可持續(xù)發(fā)展服務(wù)的AI”。
作者丨龔克
聯(lián)系客服