第四章、從Transformer到ChatGPT 3.5:通用智能的「寒武紀大爆發(fā)」
一、GPT系列進化簡史:從「嬰兒學(xué)語」到「通才學(xué)者」
1. GPT-1(2018):無監(jiān)督預(yù)訓(xùn)練的「語言嬰兒」
誕生背景:
2017年Transformer論文發(fā)表后,OpenAI的伊利亞·蘇茨克沃(Ilya Sutskever)意識到:“如果讓模型'吃掉’整個互聯(lián)網(wǎng),它會自己學(xué)會語法?!?/span>
原理突破:
- 無監(jiān)督預(yù)訓(xùn)練:讓模型像嬰兒聽大人說話一樣,通過海量文本自學(xué)(無需人工標(biāo)注)
- 任務(wù)微調(diào):用少量標(biāo)注數(shù)據(jù)教模型特定技能(如問答、翻譯)
成就與局限:
- 能續(xù)寫《哈利波特》風(fēng)格的段落,但常出現(xiàn)“赫敏用激光劍砍伏地魔”的荒謬情節(jié)
- 參數(shù)量僅1.17億,相當(dāng)于今日智能手表的運算水平
冷知識:GPT-1訓(xùn)練時“閱讀”了7000本小說,但始終分不清《傲慢與偏見》中的達西和《星球大戰(zhàn)》中的達斯·維達。
伊利亞·蘇茨克沃(Ilya Sutskever),OpenAI的聯(lián)合創(chuàng)始人
2. GPT-2(2019):零樣本學(xué)習(xí)的「叛逆少年」
技術(shù)躍遷:
- 15億參數(shù):模型規(guī)模擴大10倍,涌現(xiàn)出“零樣本學(xué)習(xí)”能力
- 上下文學(xué)習(xí):只需給出任務(wù)描述(如“將英文翻譯成中文:”),無需額外訓(xùn)練
轟動事件:
OpenAI因擔(dān)心濫用,最初拒絕公開完整模型?!都~約客》測試GPT-2生成的假新聞《特朗普宣布在火星建立高爾夫球場》時,甚至騙過了專業(yè)編輯。
經(jīng)典案例:
輸入“狗對主人說:”,GPT-2輸出“今天能不能不去寵物醫(yī)院?我保證沒偷吃沙發(fā)!”——首次展現(xiàn)出擬人化創(chuàng)作能力。
3. GPT-3(2020):千億參數(shù)的「通才覺醒」
參數(shù)爆炸:
- 1750億參數(shù):相當(dāng)于人類大腦皮層突觸數(shù)量的1/10
- 涌現(xiàn)能力:突然掌握寫代碼、解方程、編食譜等跨領(lǐng)域技能
顛覆性表現(xiàn):
- 代碼生成:輸入“用Python畫一朵會下雨的云”,5秒輸出可運行代碼
- 哲學(xué)對話:被問“生命的意義是什么?”時,回答“就像量子疊加態(tài)——觀察者決定答案?!?/span>
- 商業(yè)沖擊:初創(chuàng)公司Jasper用GPT-3生成廣告文案,估值飆升至15億美元
代價:訓(xùn)練耗電相當(dāng)于3000個美國家庭年用電量,碳排放等同駕駛汽車往返地球與月球5次。
4. ChatGPT 3.5(2022):人類反饋強化學(xué)習(xí)的「心智馴化」
關(guān)鍵技術(shù):
- RLHF(人類反饋強化學(xué)習(xí)):讓AI從“野蠻生長”變?yōu)椤拔拿鞴瘛?/span>
- 監(jiān)督微調(diào):人類標(biāo)注員教它禮貌拒絕敏感問題
- 獎勵模型:用數(shù)萬條反饋訓(xùn)練“道德評分器”
- 強化學(xué)習(xí):讓模型像學(xué)生反復(fù)修改作文般優(yōu)化回答
交互革命:
- 當(dāng)用戶說“我想自殺”,ChatGPT 3.5不再機械列舉心理熱線,而是生成“聽起來你正承受著難以想象的壓力,能多和我聊聊嗎?”
- 面對“如何造核彈”,它會回答“這涉及危險信息,建議探索更安全的科學(xué)實驗?!?/span>
冷知識:RLHF訓(xùn)練中,標(biāo)注員們曾為“AI是否該對冷笑話捧場”爭論不休,最終決定讓它在收到“為什么企鵝不害怕冷?因為它們有冰(衣)箱!”時回答“這個笑話值得一個北極熊的掌聲!”
二、Transformer的衍生應(yīng)用:改寫現(xiàn)實的「萬能模具」
1. 文本生成:從莎士比亞到黑客
- 小說創(chuàng)作:AI寫手Sudowrite用Transformer生成《蒸汽朋克版羅密歐與朱麗葉》,主角用齒輪懷表傳遞情書
- 代碼補全:GitHub Copilot在程序員輸入“//快速排序”時,自動生成50行Python代碼
- 法律文書:初創(chuàng)公司DoNotPay用Transformer生成交通罰單申訴信,成功率比人類律師高30%
2. 圖像生成:像素?zé)捊鹦g(shù)
- DALL·E 2:輸入“梵高風(fēng)格的太空鯨魚在星云中游弋”,輸出震撼畫作
- 醫(yī)學(xué)成像:Transformer生成假腫瘤CT影像,幫助醫(yī)生識別罕見病例
- 時尚革命:ZARA用AI設(shè)計“賽博朋克連衣裙”,一周內(nèi)售罄
3. 生命科學(xué):解碼生命之書
- AlphaFold 2:用Transformer預(yù)測3.5億種蛋白質(zhì)結(jié)構(gòu),將艾滋病疫苗研發(fā)提速10年
- 基因編輯:DeepMind用Transformer設(shè)計CRISPR向?qū)NA,精準度超人類專家
- 藥物發(fā)現(xiàn):英國初創(chuàng)公司用AI生成抗癌分子,其中一款已進入二期臨床試驗
冷知識
- DALL·E 2曾因用戶輸入“教皇穿巴黎世家”生成潮流教宗圖,引發(fā)神學(xué)界抗議。
- AlphaFold 2破解的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)總量,超過人類過去50年成果之和。
- 有人用Transformer生成《紅樓夢》后40回續(xù)寫,情節(jié)包含“賈寶玉開飛船逃離大觀園”——文學(xué)教授評價:“比高鶚版更有想象力?!?/span>
結(jié)語:當(dāng)「注意力」成為新石油
從Transformer到ChatGPT 3.5,這場技術(shù)革命本質(zhì)是「注意力機制」的無限延伸——它讓機器學(xué)會像人類一樣,在海量信息中捕捉關(guān)聯(lián)、推理因果、創(chuàng)造新知。而當(dāng)AI開始用我們的語言思考時,一個更根本的問題正在浮現(xiàn):如果機器能理解一切,人類該如何定義自己的不可替代性?
終章預(yù)告:從 GPT 3.5 邁向 DeepSeek,開源生態(tài)的崛起之路……
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。