隨著AI的快速發(fā)展,相信“深度學(xué)習(xí)”對(duì)大部分人來說已經(jīng)不是一個(gè)陌生的概念了。通過深度學(xué)習(xí),計(jì)算機(jī)能夠在圍棋、電子競技等領(lǐng)域戰(zhàn)勝人類。
在自然語言中存在一詞多義、多詞同義、省略、活用等各種復(fù)雜的語言現(xiàn)象,這就給計(jì)算機(jī)理解語言造成了困難。如:今天下雨,我騎車差點(diǎn)摔倒,好在我一把把把把住了!這個(gè)句子中的幾個(gè)“把”的詞性和語義都不同。
那么我們?cè)賮砜纯聪旅鎺讉€(gè)填空題:
寡肽是由4-10個(gè) 組成的化合物。
體,也叫太陽風(fēng)是指從太陽上層大氣射出的超聲速等離子體帶電粒子流。
光電現(xiàn)象由德國物理學(xué)家赫茲于1887年發(fā)現(xiàn),而正確的解釋為 所提出??茖W(xué)家們?cè)谘芯抗怆娦?yīng)的過程中,物理學(xué)者對(duì)光子的量子性質(zhì)有了更加深入的了解,這對(duì)波粒二象性概念的提出有重大影響。
當(dāng)我們要填這些空的時(shí)候,我們首先需要理解這些句子的意思,其次還要具備相關(guān)的知識(shí)。讓計(jì)算機(jī)來回答這些問題的時(shí)候,可就難上加難嘍。
現(xiàn)在,我們有了最強(qiáng)的中文自然語言處理(NLP)預(yù)訓(xùn)練模型——艾尼(ERNIE),可以使計(jì)算機(jī)具有很好的中文語義理解的能力,幫助各種中文NLP任務(wù)快速取得顯著的效果提升!
艾尼(ERNIE)是百度自研的持續(xù)學(xué)習(xí)語義理解框架,它利用百度海量數(shù)據(jù)和飛槳(PaddlePaddle)多機(jī)多卡高效訓(xùn)練優(yōu)勢,通過深度神經(jīng)網(wǎng)絡(luò)與多任務(wù)學(xué)習(xí)等技術(shù),持續(xù)學(xué)習(xí)海量數(shù)據(jù)和知識(shí)。
基于該框架預(yù)訓(xùn)練模型,已累計(jì)學(xué)習(xí)10億多知識(shí),覆蓋詞法、句法、語義等多個(gè)維度,有很強(qiáng)的通用語義表示能力,在中英文NLP任務(wù)上均表現(xiàn)優(yōu)異,適用于各種NLP應(yīng)用場景,效果提升明顯,使用便捷高效。
在應(yīng)用場景方面,艾尼(ERNIE)已經(jīng)在百度搜索問答、度小滿金融風(fēng)控、好看視頻推薦等產(chǎn)品紛紛落地,并取得了顯著的效果提升。
優(yōu)勢一:任務(wù)效果領(lǐng)先
業(yè)內(nèi)領(lǐng)先的語義理解預(yù)訓(xùn)練模型,刷新多個(gè)中英文NLP基礎(chǔ)任務(wù)、應(yīng)用任務(wù)的效果
優(yōu)勢二:少量樣本快捷訓(xùn)練
少量訓(xùn)練數(shù)據(jù)即可達(dá)到良好效果,訓(xùn)練便捷,效果提升迅速
優(yōu)勢三:多種方案高效預(yù)測
支持多倍效果無損模型壓縮,并有多種性能優(yōu)化方案以滿足應(yīng)用需求
優(yōu)勢四:中文場景技術(shù)服務(wù)
完善的中文應(yīng)用場景技術(shù)服務(wù)支持,產(chǎn)業(yè)NLP應(yīng)用實(shí)踐持續(xù)錘煉
怎么樣,是不是很強(qiáng)大呢?
對(duì)于眾多NLP從事者而言,ERNIE是處理中文領(lǐng)域NLP任務(wù)的首選。相較于BERT,ERNIE的改進(jìn)包括短語/實(shí)體掩碼(這個(gè)idea后來也被BERT引用并發(fā)布了WWM-BERT)、詞法、句法、語義多層預(yù)訓(xùn)練任務(wù)持續(xù)學(xué)習(xí)等。
因此說它是史上最強(qiáng),并不夸張。
聯(lián)系客服