來源:cs.princeton.ed
編輯:小芹、大明
AI不是萬靈藥,但越來越多的人把它說成是萬靈藥,在這些人的鼓吹下,更多的人可能真的會(huì)把AI當(dāng)成萬靈藥。
那么,如何在周圍人都在吹的氛圍下冷靜下來,分辨真假?近日,普林斯頓大學(xué)計(jì)算機(jī)系A(chǔ)rvind Narayanan副教授撰寫了一份報(bào)告,題目就是《如何區(qū)分AI“萬靈假藥”》。
報(bào)告全文要點(diǎn)如下:
1、有很多與AI無關(guān)的東西都被打上AI標(biāo)簽,目前已經(jīng)誕生的真正的、有社會(huì)影響力的AI技術(shù)無意間充當(dāng)了這些冒牌貨的保護(hù)傘。
2、很多宣稱采用AI算法的技術(shù)涉及對社會(huì)后果的預(yù)測。事實(shí)是,我們并不能預(yù)測未來,但當(dāng)涉及AI時(shí),這個(gè)常識似乎就我們無視了。
3、在風(fēng)險(xiǎn)行為預(yù)測上,手動(dòng)評分要比AI評分靠譜得多。比如違規(guī)駕駛,人工計(jì)分,到一定程度吊銷駕照,這個(gè)計(jì)分還是要交給人來做。
作者首先舉了個(gè)例子。下邊這個(gè)網(wǎng)站宣稱,只用一段30秒的短視頻,就能評估出你的職業(yè)前途和工作的穩(wěn)定程度。聽起來是不是很神奇?只要拍一段視頻傳上去,網(wǎng)站就會(huì)自動(dòng)評估出多個(gè)指標(biāo),可視化呈現(xiàn)后給出一個(gè)綜合評分。
它聲稱,評估分?jǐn)?shù)結(jié)果和視頻中的你說的內(nèi)容甚至都沒關(guān)系,完全是AI算法根據(jù)肢體語言、講話的方式和風(fēng)格這些東西得出的。
而實(shí)際上,這只是個(gè)加了外殼的“隨機(jī)數(shù)生成器”。你的職業(yè)是否穩(wěn)定,全看運(yùn)氣。
為什么這種包裝成AI的假貨這么多?
第一、 現(xiàn)在的“AI”是個(gè)時(shí)髦的保護(hù)傘,和AI沾邊可以提升身價(jià)。
第二、 一些AI技術(shù)確實(shí)實(shí)現(xiàn)了真正的、獲得大眾認(rèn)可的巨大進(jìn)步。
第三、 大部分群眾不懂AI,企業(yè)可以把任何東西貼上AI標(biāo)簽,再賣出去。
這個(gè)例子只是說明在HR領(lǐng)域的問題,實(shí)際上在其他領(lǐng)域內(nèi),這種對AI技術(shù)的故意夸大的現(xiàn)象可能更嚴(yán)重。在這份報(bào)告中,作者將現(xiàn)在的AI應(yīng)用模式大體分為3類。
第一類:認(rèn)知類AI技術(shù)。主要包括內(nèi)容識別(包括反圖片搜索)、人臉識別、基于醫(yī)療影像的輔助診斷、文本-語音轉(zhuǎn)換,以及DeepFake等。作者認(rèn)為,這類技術(shù)基本上屬于貨真價(jià)實(shí)的快速技術(shù)進(jìn)步,甚至DeepFake的過于逼真表現(xiàn)還引發(fā)了人們在道德上的擔(dān)憂。
作者認(rèn)為,這類AI技術(shù)造假或吹??臻g不大的主要原因是結(jié)果和判斷標(biāo)準(zhǔn)的確定性。無論是人臉識別還是文本-語音轉(zhuǎn)換,其對錯(cuò)標(biāo)準(zhǔn)是非常明確的。
第二類:自動(dòng)化判斷類AI技術(shù)。包括垃圾郵件檢測、盜版內(nèi)容檢測、論文自動(dòng)評分、內(nèi)容推薦等。這類應(yīng)用盡管還遠(yuǎn)遠(yuǎn)稱不上完善,但是正在進(jìn)步,應(yīng)用前景在逐步拓寬。
對于這類AI來說,判斷標(biāo)準(zhǔn)開始變得有些模糊,一篇文章寫得好不好,一封電郵是不是垃圾郵件,對于這些問題,不同的人可能會(huì)有不同的看法,AI會(huì)逐步學(xué)習(xí)人類的判斷和推理方式,但往往免不了犯錯(cuò)。
第三類:社會(huì)后果預(yù)測類AI。包括職業(yè)表現(xiàn)預(yù)測、慣犯行為預(yù)測、政策預(yù)測、恐怖襲擊預(yù)測等。作者認(rèn)為,這類AI基本上其真實(shí)性都是值得懷疑的。
作者認(rèn)為,在我們自己尚且不能預(yù)測未來的情況下,卻要把這個(gè)任務(wù)交給AI,并根據(jù)結(jié)果來制定政策,這種選擇有違常識,而且很可能造成不良后果。
AI預(yù)測社會(huì)后果?效果比線性回歸好不了多少
第三類AI應(yīng)用有關(guān)預(yù)測社會(huì)后果,它們大多數(shù)時(shí)候從根本上就是可疑的:
預(yù)測犯罪慣犯
預(yù)測工作表現(xiàn)
預(yù)測警務(wù)
預(yù)測恐怖主義風(fēng)險(xiǎn)
預(yù)測問題兒童
Shazam(一款音樂識別應(yīng)用)
反向圖片搜索
人臉識別
基于醫(yī)學(xué)成像的醫(yī)療診斷
語音轉(zhuǎn)文本
Deepfakes
垃圾郵件檢測
版權(quán)侵犯
自動(dòng)論文評分
仇恨語音檢測
內(nèi)容推薦
預(yù)測累犯
預(yù)測工作成功
預(yù)測警務(wù)
預(yù)測恐怖主義風(fēng)險(xiǎn)
預(yù)測問題兒童
“脆弱家庭(未婚家長與孩子組成的家庭)與孩子福利”項(xiàng)目跟蹤研究了1998-2000年出生在美國大城市的近5000名兒童(大約四分之三是未婚父母所生),這些兒童所在的“家庭”比普通家庭面臨更大的分裂和貧困的危險(xiǎn)。研究圍繞四個(gè)方面展開:(1)未婚父母,尤其是父親的條件和能力是什么?(2)未婚父母關(guān)系的本質(zhì)是什么?(3)這些家庭出生的孩子是怎樣生活的?(4)政策和環(huán)境條件如何影響這樣的家庭和兒童? 該項(xiàng)目的人口研究數(shù)據(jù)檔案辦公室公開提供六組相關(guān)數(shù)據(jù)。
孩子的平均成績(學(xué)業(yè)成績)
孩子們的勇氣(激情和毅力)
家庭的物質(zhì)困難(衡量極端貧困的程度)
驅(qū)逐家庭(不支付租金或抵押)
照顧者的裁員
工作培訓(xùn)(如果主要照顧者將參加工作技能計(jì)劃)
對個(gè)人數(shù)據(jù)的需求
權(quán)力從領(lǐng)域?qū)<掖笠?guī)模轉(zhuǎn)移到不負(fù)責(zé)任的科技公司手中
缺乏可解釋性
影響干預(yù)
準(zhǔn)確性流于表面
……
人工智能擅長某些任務(wù),但無法預(yù)測社會(huì)后果。
我們必須抵制意圖混淆這一事實(shí)的巨大商業(yè)利益。
在大多數(shù)情況下,手動(dòng)評分規(guī)則同樣準(zhǔn)確,更加透明,值得考慮。