大家好,我是來自硅谷工程師屈直。
要說近期關于人工智能的大事件,大概要說曾經叱咤棋壇的Alpha go,被升級版的Alpha zero以0比100擊敗的新聞了吧。人類第一棋手柯潔“抱定必死信念”的豪言壯語尚在耳邊,沒想到令其飲恨的“大魔王”,這么快就被另一個“大魔王”打倒了,這真是有點高手過招,后浪把前浪拍死在沙灘上的意思。
今日內容聚焦
1.“第一棋手”柯潔被alpha go打敗是否意味著一種機器人終將勝過人類的前兆呢?
2. 圍棋要比國際象棋復雜多少?
3. 國際象棋最強大腦“深藍”由何組成?
當初“第一棋手”柯潔被alpha go打敗,“機器人超越人腦”,似乎成了定局。網上一片哀鴻遍野,什么“震驚!人類要被機器人統(tǒng)治了”之類的言論也是傳得滿天飛。為什么大家的反應這么大呢?因為在大家的印象中,能把棋類運動玩出成績的,應該都是些擁有“超級大腦”極其聰明的人。現在柯潔、李世石這些“棋圣”竟然在自己最聰明的領域被人工智能擊敗了,這怎能不叫人心生不安?AI在棋類游戲領域對人腦的“智商壓制”,是否意味著一種機器人終將勝過人類的前兆呢?
事實上人類在棋類運動中被機器擊敗,這并不是第一次。本講中,我就帶領大家看看上個世紀人類棋手和計算機的交鋒。
時間回到北京時間 1997 年 5 月 11 日的清晨,在與一臺名為“深藍”的電腦對弈的最后一局中,人類有史以來最偉大的國際象棋大師卡斯帕羅夫面帶沮喪,不得不舉了白旗。這場舉世矚目的人機大戰(zhàn)以計算機取勝而落下帷幕,國際象棋領域的“最強大腦”輸給了計算機。而就在一年前,他還曾經在另一場比賽中擊敗“深藍”,拿到40萬美金獎金。沒想到士別三日,刮目相待。
跟如今的alpha go、alpha zero不同,這個“深藍”可是一個大家伙,它的外表就像一個黑色的大柜子,重達1.4噸,有32個節(jié)點,每個節(jié)點有8塊專門為進行國際象棋對弈設計的處理器,共計256塊這樣的處理器,集成在IBM的并行運算系統(tǒng)中,從而擁有了每秒超過兩億步的計算速度。這是一個很簡單粗暴的邏輯:既然我不會思考,也沒有什么直覺可言,那我就只要通過超人的計算速度,把棋盤上可能出現的每一種可能性都算一遍就可以了——這就是深藍算法的核心,暴力窮舉。嚴格來講,這還并不是人工智能,只是在硬件上的強大而已。
“深藍”的“大腦”——也就是芯片,主要由三部分組成:走棋模塊,評估模塊,以及搜索控制器。這三個部分,都是為了“優(yōu)化運算速度”這一終極目標而服務的。
其中需要說一下的是占據了深藍“大腦”三分之二面積的評估模塊。它主要分三個部分。
首先是棋子位置評估。它采用的模式是在每一步后對盤面上所有棋子當前所處的位置計分,不同棋子處于不同位置的分值都被事先計算好并寫入硬件,在實戰(zhàn)中,它會靈活的適用當前局面下得分較高的走法。為了簡化計算,IBM團隊還根據大量的大師級棋譜,向“深藍”輸入了8000多種行棋模式,這就更加簡化了計算的過程。
然后是殘局評估。IBM研制小組向“深藍”輸入了100年來所有國際特級大師開局和殘局的下法,這就使它能夠在一些時候直接參考歷史上大師們的下法,從而減少計算量。
最后是慢速評估。它牽涉的主要是一些國際象棋的特殊指標,比如局面的結構,個人的棋風這一類“看不見摸不著”的東西。當然,這些所謂的“特殊指標”終究也是反映在棋盤上的。深藍就可以憑這種評估方法,在全局上進行自我調整。
事實上,卡斯帕羅夫在與“深藍”對奕時,就采用了一些“出奇制勝”的策略。他故意在開局中用出和尋常棋路大相徑庭的“怪招”來干擾“深藍”的棋路。然而,“深藍”迅速拋開了那些“套路”,用非人的計算速度碾壓了卡斯帕羅夫。
當年這個事情出來以后,人們確實有些“機器比人強”的擔憂,不過心里不禁還有一線希望——因為我們還有圍棋。國際象棋只是一個8乘8的格子,每一步只有35種可能,每一盤棋80回合,就算加上各種變量,這個數量對于計算機來講也實在不算大。比如“深藍”可以算到每一步之后12步棋的信息,而人類最強的棋手也只能做到10步。這就和跟開了掛的選手比賽一樣,輸是很正常的。
那圍棋就復雜的多了,用“深藍”的方式肯定無法取勝。它每步有250種可能,一局棋可以長達150回合。這就不是憑借“粗暴”的計算,蠻力的“強記”,以“固定”的程序邏輯決策,或窮極所有可能性進行篩選就可以勝任的了。這導致人類一直相信,再強大的機器人也是沒有辦法對抗咱們的國粹。但是隨著阿爾法狗出現,它很快就讓我們無言了,然后留給我們一連串的興奮與憂傷。
說到興奮,圍棋問題與現實生活中的問題是相通的,國人甚至將“博弈”圍棋視為洞悉人性、參悟人生的過程。然而,現在下圍棋的卻是一個機器,意味著這個機器除擁有超強的記憶能力、邏輯思維能力,還要擁有創(chuàng)造力甚至個性。
柯潔就曾這樣贊嘆過AlphaGo的“棋風”:“感覺就像一個有血有肉的人在下棋一樣,該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個棋風,真是看不出出自程序之手?!?nbsp;AlphaGo有好幾次落子極其“非常規(guī)”,許多專業(yè)棋手都表示“看不懂”。而聶衛(wèi)平甚至表示自己想要對AlphaGo的“驚人一手”脫帽致敬,因為它“用不可思議的下法辟立了圍棋常識之外的新天地”。也就是說,這不是AlphaGo從既往棋局中“復制”過來的,而是自己“創(chuàng)造”的戰(zhàn)術打法。
這個AlphaGo的最主要工作原理,就是近幾年人工智能領域最為熱門,也是我們在之前經常提到的“深度學習”,通過模仿人類大腦神經網絡,讓機器模擬人腦的機制進行記憶、學習、分析、思維,還有創(chuàng)造……這一部分,我將在下一講當中,為大家另作介紹。
今天,我主要帶大家回望了一下20年前的“人機大戰(zhàn)”。從“深藍”到“阿爾法狗”,人類科技的進化史,似乎也是一個人們不斷立flag、又不斷被機器“吊打”的過程。不過這其中突破性的歷史意義,早已超越勝負。因為在未來,人工智能肯定不單純會用來下棋,像我們前面所講,以及后面會繼續(xù)為大家講的那樣,它會掀起各個領域的產業(yè)變革、經濟變革,甚至是社會變革。
知識清單
1. 事實上人類在棋類運動中被機器擊敗,AlphaGo并不是第一次。
2. AlphaGo最主要工作原理,就是近幾年人工智能領域最為熱門的“深度學習”
3.“深藍”的“大腦”——也就是芯片,主要由三部分組成:走棋模塊,評估模塊,以及搜索控制器。
今日思考
不過回到棋牌類這個小小的領域,大師們研究棋譜、與人實戰(zhàn)好幾千年,又從中參悟到了那么人生哲理和自然規(guī)律,可以說是源遠流長了,沒成想卻被機器人打敗。如果換做你的話,如果你所玩的游戲中的“最強玩家”被機器擊敗,這會影響從這個游戲中尋找快樂的動力嗎?你對“人類最強大腦被機器人擊敗”這件事怎么看呢?
歡迎把你的見解在評論區(qū)與我們分享。我是屈直,我們下期再見。
知之×世界說重磅推出知識付費課程:輸掉的未來
掃描下方二維碼,《輸掉的未來》更多精彩內容盡在“知之”微信公眾號