本文來源:兵推天下
在過去一年,生成人工智掀起一股熱潮。而兵棋推演在美國海軍陸戰(zhàn)隊(duì)大學(xué)占有一席之地。該學(xué)校的兵棋專家凱文·威廉森(Kevin Williamson)就大語言模型能否增強(qiáng)兵棋推演并促進(jìn)專業(yè)軍事教育展開了研究。研究報(bào)告具體內(nèi)容如下。
01
前言
生成AI正在成為全球諸多行業(yè)關(guān)注的重點(diǎn)。像CHatGPT-4等大語言模型,已經(jīng)在增強(qiáng)勞動(dòng)力方面展示了巨大的前景。
盡管生成AI能夠?yàn)闄C(jī)構(gòu)提供價(jià)值,但其主要爭論點(diǎn)是訪問這些模型時(shí)的數(shù)據(jù)和網(wǎng)絡(luò)安全問題。
本報(bào)告旨在做兩項(xiàng)工作:
02
下一代戰(zhàn)斗伙伴
假設(shè)你是美國海軍陸戰(zhàn)隊(duì)的一名上尉,你剛調(diào)任到匡提科MCB,并奉命前往遠(yuǎn)征戰(zhàn)爭學(xué)院(EWS)。按專業(yè)來講你是一名海軍陸戰(zhàn)隊(duì)步兵軍官,而在空閑時(shí)間是一名學(xué)者。最近你被告知將在第二天參加一場兵棋推演,使用的兵棋是“指揮:專業(yè)版”(Command: Professional Edition),你已經(jīng)被安排好為學(xué)員小組控制空域。
你非常有信心,但有一個(gè)問題,你不知道自己不了解哪些情況。
這種情況在一般的兵棋推演中很常見,不僅是海軍陸戰(zhàn)隊(duì)大學(xué)這樣。你無法控制參與人員的專業(yè)和背景。作為兵棋主題專家,確保學(xué)習(xí)目標(biāo)得以實(shí)現(xiàn),并尋找不斷改進(jìn)這一過程的方法,是一項(xiàng)重要職能。
現(xiàn)在,我們假設(shè)遠(yuǎn)征戰(zhàn)爭學(xué)院的這位上校對(duì)于如何實(shí)施空中戰(zhàn)役知之甚少,他將資產(chǎn)、預(yù)期目標(biāo)輸入了大語言模型,LLM不僅能夠提供打擊編隊(duì)建議,還能告訴他為什么選擇該行動(dòng)方案。
03
教育價(jià)值(專業(yè)軍事教育)
提高學(xué)習(xí)效果
讓生產(chǎn)AI成為學(xué)員使用的工具,能夠讓學(xué)員沉浸于想定中,減少學(xué)員感到不知所措,或者一直盯著兵棋機(jī)制的機(jī)會(huì),進(jìn)而提高總體學(xué)習(xí)效果。
跨域訓(xùn)練
將生產(chǎn)AI整合到兵棋中,為學(xué)員提供了參與教學(xué)內(nèi)容,并了解到所有領(lǐng)域的威脅、能力和考量。
教學(xué)機(jī)會(huì)
通過提供兵棋“沙盒”學(xué)習(xí)環(huán)境,生成AI能夠?yàn)檎麄€(gè)機(jī)構(gòu)的教職工提供教學(xué)機(jī)會(huì)。在兵棋推演過程中,學(xué)員往往會(huì)犯錯(cuò)誤或者忘記一些事情,就像搜集AAR筆記進(jìn)行討論一樣,我們也可根據(jù)這些筆記,圍繞發(fā)現(xiàn)的錯(cuò)誤點(diǎn),制定未來兵棋想定。
可能你希望生成一個(gè)兵棋想定,來考察存在爭議環(huán)境中的持續(xù)保障問題。生成AI可以做到這一點(diǎn)。
也許某個(gè)學(xué)術(shù)班在某些方面有些落后,或者沒有重視規(guī)劃過程中的某個(gè)概念,可以創(chuàng)建一些專門針對(duì)已發(fā)現(xiàn)的重點(diǎn)問題的想定。
04
概念驗(yàn)證
作為美國海軍陸戰(zhàn)隊(duì)大學(xué)的兵棋主題專家,我和當(dāng)時(shí)的許多其他人一樣,覺得必須為ChatGPT找到一個(gè)用武之地。最終,我嘗試?yán)闷浞治鰪膶I(yè)軟件中導(dǎo)出的CSV數(shù)據(jù),但發(fā)現(xiàn)并不可靠,最終我認(rèn)為這不值得投入大量時(shí)間。聽了很多關(guān)于 ChatGPT 的討論,發(fā)現(xiàn)也并不適合我。我并不認(rèn)為我們離 '天網(wǎng) '很近,也不認(rèn)為人工智能是壞的,不值得我們?cè)诒孱I(lǐng)域花費(fèi)時(shí)間。
我的情況很特殊。我的任務(wù)是加強(qiáng)海軍陸戰(zhàn)隊(duì)大學(xué)的專業(yè)軍事教育,要在這方面使用人工智能,需要向前邁出一小步。我前面提到的 '下一代戰(zhàn)斗伙伴'就是生成人工智能。
一款用于國防部兵棋推演應(yīng)用的生成AI正在從頭開始設(shè)計(jì),它的聯(lián)合創(chuàng)建者曾在美國海軍陸戰(zhàn)隊(duì)擔(dān)任過5年軍官,給了我訪問該AI的權(quán)限。
我決定通過該模型來驗(yàn)證在兵棋推演中應(yīng)用生成式AI想法的可行性,因?yàn)榕c我見過的其他模型不同,它能為所提供的材料提供來源。除其他兵棋推演功能外,它還能創(chuàng)建虛假媒體插入,重現(xiàn)實(shí)時(shí)信息環(huán)境。
本研究中的概念驗(yàn)證很簡單。在“指揮:專業(yè)版”中創(chuàng)建一個(gè)基本想定,看看該模型是否不僅能為我創(chuàng)建一個(gè)任務(wù)以嵌入到兵棋中,還能解釋為什么要選擇某些彈藥或飛機(jī)等。
要取得成功,模型首先要能提供教育價(jià)值,然后才是兵棋效果。在兵棋推演中取得成功只是錦上添花,重要性低于為學(xué)生提供信息。
為了進(jìn)行更嚴(yán)格的審查,我收集了用戶提交的想定信息,以便與模型在兵棋中的成功程度進(jìn)行比較。大語言模型任務(wù)運(yùn)行了200 次,每 50 次為一組,每組都有不同的武器釋放授權(quán)(WRA)和理論設(shè)置。
05
想定
藍(lán)方擁有12x12x F-35A, 12x F-22A 以及 4x EA-18G。紅方擁有12x J-20B,正在執(zhí)行戰(zhàn)斗空中巡邏任務(wù),2x SA-21 炮組以及1x HQ-16雷達(dá),這生成AI打擊包的主要目標(biāo)。
我們將以用戶提交的想定資料為基準(zhǔn),判斷在“指揮:專業(yè)版”兵棋中生成AI執(zhí)行基本任務(wù)的有效性。
通過內(nèi)部因素衡量生成AI迭代成功與否。
盡管這不能完全衡量任務(wù)是否成功,但將生成AI成功輸入兵棋中,考慮其在兵棋推演中的附屬優(yōu)勢(shì)時(shí),這是非常有用的方法。下文提供了用戶提交的想定資料,一些生成AI提示示例,最后是生成AI方案在“指揮:專業(yè)版”中的有效性。
用戶提交的想定資料
生成AI提示
請(qǐng)使用下述信息為虛擬想定生成一個(gè)打擊編隊(duì)。在N27o03’24’’ E27o58’31’’ ,你擁有12xF-22A猛禽戰(zhàn)斗機(jī)、12xF-35A閃點(diǎn)II戰(zhàn)斗機(jī)、4xEA-18G電子戰(zhàn)機(jī)。你的目標(biāo)是N24o49’47’’的SA-21防空導(dǎo)彈系統(tǒng),N24o49’39’’ E125o08’46’’的HQ-16A搜索雷達(dá)以及N24o49’39’’ E125o08’47’’的SA-21防空導(dǎo)彈。你可預(yù)計(jì)大約12xJ-20敵機(jī)在執(zhí)行巡邏任務(wù)。
戰(zhàn)機(jī)和戰(zhàn)術(shù)方面的教育價(jià)值
彈藥方面的教育價(jià)值
生成AI任務(wù)--“指揮:專業(yè)版”中的蒙特卡洛方法
06
概念結(jié)果
因?yàn)樯葾I沒有與Command軟件進(jìn)行具體整合,其給出的提示存在一些問題,但總體而言,從教育角度來看,在人在環(huán)中的情況下,其仍然是非常強(qiáng)大的工具。考慮到用戶提交的想定資料在事情發(fā)生時(shí)能夠?qū)ζ溥M(jìn)行修改,我相信生成AI模型在規(guī)劃用于“指揮:專業(yè)版”的打擊包時(shí)表現(xiàn)得很好。雖然我還有更多的研究和測試工作要做,但我相信在兵棋推演和專業(yè)軍事教育中使用生成AI是加快學(xué)習(xí)進(jìn)程下一步要做的事情。
戰(zhàn)爭1 | 戰(zhàn)爭2 | 戰(zhàn)爭3 | 戰(zhàn)爭4 | |
成功率 | 56% | 56% | 62% | 48% |
摧毀的雷達(dá) | 68% | 88% | 72% | 82% |
成功(無損失) | 4% | 0% | 8% | 8% |
聯(lián)系客服