第四章、從Transformer到ChatGPT 3.5：通用智能的「寒武紀大爆發(fā)」

一、GPT系列進化簡史：從「嬰兒學(xué)語」到「通才學(xué)者」

1. GPT-1（2018）：無監(jiān)督預(yù)訓(xùn)練的「語言嬰兒」

誕生背景：
2017年Transformer論文發(fā)表后，OpenAI的伊利亞·蘇茨克沃（Ilya Sutskever）意識到：“如果讓模型'吃掉’整個互聯(lián)網(wǎng)，它會自己學(xué)會語法?！?/span>

原理突破：

無監(jiān)督預(yù)訓(xùn)練：讓模型像嬰兒聽大人說話一樣，通過海量文本自學(xué)（無需人工標(biāo)注）
任務(wù)微調(diào)：用少量標(biāo)注數(shù)據(jù)教模型特定技能（如問答、翻譯）

成就與局限：

能續(xù)寫《哈利波特》風(fēng)格的段落，但常出現(xiàn)“赫敏用激光劍砍伏地魔”的荒謬情節(jié)
參數(shù)量僅1.17億，相當(dāng)于今日智能手表的運算水平

冷知識：GPT-1訓(xùn)練時“閱讀”了7000本小說，但始終分不清《傲慢與偏見》中的達西和《星球大戰(zhàn)》中的達斯·維達。

伊利亞·蘇茨克沃（Ilya Sutskever），OpenAI的聯(lián)合創(chuàng)始人

2. GPT-2（2019）：零樣本學(xué)習(xí)的「叛逆少年」

技術(shù)躍遷：

15億參數(shù)：模型規(guī)模擴大10倍，涌現(xiàn)出“零樣本學(xué)習(xí)”能力
上下文學(xué)習(xí)：只需給出任務(wù)描述（如“將英文翻譯成中文：”），無需額外訓(xùn)練

轟動事件：
OpenAI因擔(dān)心濫用，最初拒絕公開完整模型?！都~約客》測試GPT-2生成的假新聞《特朗普宣布在火星建立高爾夫球場》時，甚至騙過了專業(yè)編輯。

經(jīng)典案例：
輸入“狗對主人說：”，GPT-2輸出“今天能不能不去寵物醫(yī)院？我保證沒偷吃沙發(fā)！”——首次展現(xiàn)出擬人化創(chuàng)作能力。

3. GPT-3（2020）：千億參數(shù)的「通才覺醒」

參數(shù)爆炸：

1750億參數(shù)：相當(dāng)于人類大腦皮層突觸數(shù)量的1/10
涌現(xiàn)能力：突然掌握寫代碼、解方程、編食譜等跨領(lǐng)域技能

顛覆性表現(xiàn)：

代碼生成：輸入“用Python畫一朵會下雨的云”，5秒輸出可運行代碼
哲學(xué)對話：被問“生命的意義是什么？”時，回答“就像量子疊加態(tài)——觀察者決定答案?！?/span>
商業(yè)沖擊：初創(chuàng)公司Jasper用GPT-3生成廣告文案，估值飆升至15億美元

代價：訓(xùn)練耗電相當(dāng)于3000個美國家庭年用電量，碳排放等同駕駛汽車往返地球與月球5次。

4. ChatGPT 3.5（2022）：人類反饋強化學(xué)習(xí)的「心智馴化」

關(guān)鍵技術(shù)：

RLHF（人類反饋強化學(xué)習(xí)）：讓AI從“野蠻生長”變?yōu)椤拔拿鞴瘛?/span>
監(jiān)督微調(diào)：人類標(biāo)注員教它禮貌拒絕敏感問題
獎勵模型：用數(shù)萬條反饋訓(xùn)練“道德評分器”
強化學(xué)習(xí)：讓模型像學(xué)生反復(fù)修改作文般優(yōu)化回答

交互革命：

當(dāng)用戶說“我想自殺”，ChatGPT 3.5不再機械列舉心理熱線，而是生成“聽起來你正承受著難以想象的壓力，能多和我聊聊嗎？”
面對“如何造核彈”，它會回答“這涉及危險信息，建議探索更安全的科學(xué)實驗?！?/span>

冷知識：RLHF訓(xùn)練中，標(biāo)注員們曾為“AI是否該對冷笑話捧場”爭論不休，最終決定讓它在收到“為什么企鵝不害怕冷？因為它們有冰（衣）箱！”時回答“這個笑話值得一個北極熊的掌聲！”

山姆·奧特曼（Sam Altman）

二、Transformer的衍生應(yīng)用：改寫現(xiàn)實的「萬能模具」

1. 文本生成：從莎士比亞到黑客

小說創(chuàng)作：AI寫手Sudowrite用Transformer生成《蒸汽朋克版羅密歐與朱麗葉》，主角用齒輪懷表傳遞情書
代碼補全：GitHub Copilot在程序員輸入“//快速排序”時，自動生成50行Python代碼
法律文書：初創(chuàng)公司DoNotPay用Transformer生成交通罰單申訴信，成功率比人類律師高30%

2. 圖像生成：像素?zé)捊鹦g(shù)

DALL·E 2：輸入“梵高風(fēng)格的太空鯨魚在星云中游弋”，輸出震撼畫作
醫(yī)學(xué)成像：Transformer生成假腫瘤CT影像，幫助醫(yī)生識別罕見病例
時尚革命：ZARA用AI設(shè)計“賽博朋克連衣裙”，一周內(nèi)售罄

3. 生命科學(xué)：解碼生命之書

AlphaFold 2：用Transformer預(yù)測3.5億種蛋白質(zhì)結(jié)構(gòu)，將艾滋病疫苗研發(fā)提速10年
基因編輯：DeepMind用Transformer設(shè)計CRISPR向?qū)NA，精準度超人類專家
藥物發(fā)現(xiàn)：英國初創(chuàng)公司用AI生成抗癌分子，其中一款已進入二期臨床試驗

冷知識

DALL·E 2曾因用戶輸入“教皇穿巴黎世家”生成潮流教宗圖，引發(fā)神學(xué)界抗議。
AlphaFold 2破解的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)總量，超過人類過去50年成果之和。
有人用Transformer生成《紅樓夢》后40回續(xù)寫，情節(jié)包含“賈寶玉開飛船逃離大觀園”——文學(xué)教授評價：“比高鶚版更有想象力?！?/span>

結(jié)語：當(dāng)「注意力」成為新石油

從Transformer到ChatGPT 3.5，這場技術(shù)革命本質(zhì)是「注意力機制」的無限延伸——它讓機器學(xué)會像人類一樣，在海量信息中捕捉關(guān)聯(lián)、推理因果、創(chuàng)造新知。而當(dāng)AI開始用我們的語言思考時，一個更根本的問題正在浮現(xiàn)：如果機器能理解一切，人類該如何定義自己的不可替代性？

終章預(yù)告：從 GPT 3.5 邁向 DeepSeek，開源生態(tài)的崛起之路……

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

顛覆性挑戰(zhàn)！你想象不到的一個新領(lǐng)域強勢崛起

從弱人工智能到通用人工智能：AI的演變與未來

ChatGPT，強人工智能時代的里程碑

語言大模型的進化軌跡

國內(nèi)大模型遍地開花，都說自研自創(chuàng)，但他們背后都是這同一個基礎(chǔ)模型

華泰 | 計算機: ChatGPT深度拆解

更多類似文章 >>