首頁(yè)
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人知識(shí) > OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3  
 

OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

來源:AI MOOC人工智能平臺(tái)      編輯:創(chuàng)澤      時(shí)間:2020/6/9      主題:其他   [加盟]

2020年5月底OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3,最大的GPT-3模型參數(shù)達(dá)到了1750億個(gè)參數(shù)。論文《Language Models are Few-Shot Learners》長(zhǎng)達(dá)74頁(yè)已發(fā)布在arXiv。

有網(wǎng)友估算最大的GPT-3模型大小大約有700G,這個(gè)大小即使OpenAI公開模型,我們一般的電腦也無法使用。一般需要使用分布式集群才能把這個(gè)模型跑起來。雖然OpenAI沒有公布論文的花費(fèi),不過有網(wǎng)友估計(jì)這篇論文大約花費(fèi)了上千萬(wàn)美元用于模型訓(xùn)練。

如此驚人的模型在模型的設(shè)計(jì)上和訓(xùn)練上有什么特別之處嗎?答案是沒有。作者表示GPT-3的模型架構(gòu)跟GPT-2是一樣的,只是使用了更多的模型參數(shù)。模型訓(xùn)練也跟GPT-2是一樣的,使用預(yù)測(cè)下一個(gè)詞的方式來訓(xùn)練語(yǔ)言模型,只不過GPT-3訓(xùn)練時(shí)使用了更多的數(shù)據(jù)。

既然這樣,那這只怪獸特別之處是什么?GPT-3論文的核心在于下圖:






多尺度圖卷積神經(jīng)網(wǎng)絡(luò):有效統(tǒng)一三維形狀離散化特征表示

解決了傳統(tǒng)圖卷積神經(jīng)網(wǎng)絡(luò)中圖節(jié)點(diǎn)學(xué)習(xí)到的特征對(duì)圖分辨率和連接關(guān)系敏感的問題,可以實(shí)現(xiàn)在低分辨率的三維形狀上學(xué)習(xí)特征,在高低分辨率形狀之上進(jìn)行測(cè)試,并且保持不同分辨率特征的一致性

履約時(shí)間預(yù)估:如何讓外賣更快送達(dá)

外賣履約時(shí)間預(yù)估模型,預(yù)估的是從用戶下單開始到騎手將餐品送達(dá)用戶手中所花的時(shí)間

性能超越最新序列推薦模型,華為諾亞方舟提出記憶增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)

記憶增強(qiáng)的圖神經(jīng)網(wǎng)絡(luò)對(duì)短期的商品語(yǔ)境信息建模,并使用共享的記憶網(wǎng)絡(luò)來捕捉商品之間的長(zhǎng)期依賴,對(duì)多個(gè)模型進(jìn)行了對(duì)比,在Top-K序列推薦中效果極佳

如何創(chuàng)造可信的AI,這里有馬庫(kù)斯的11條建議

馬庫(kù)斯系統(tǒng)性地闡述了對(duì)當(dāng)前AI研究界的批判,從認(rèn)識(shí)科學(xué)領(lǐng)域中針對(duì)性地給出了11條可執(zhí)行的建議

用于微創(chuàng)手術(shù)的觸覺傳感器(二)

MIS 和RMIS觸覺傳感器最常用的傳感原理是基于電氣的傳感器。這些觸覺傳感器進(jìn)一步分為壓阻型、壓電型和電容型傳感器

用于微創(chuàng)手術(shù)的觸覺傳感器

應(yīng)用于MIS的觸覺傳感器主要是基于電學(xué)或光學(xué)原理開發(fā)的,應(yīng)該是小尺寸和圓柱形的,可在導(dǎo)管的管身或尖端集成

醫(yī)院候診區(qū)流感性疾病的非接觸式綜合檢測(cè)平臺(tái)

非接觸式檢測(cè)平臺(tái)FluSense由麥克風(fēng)陣列和熱成像攝像機(jī)組成,用于捕捉不同的候診室人群行為,包括咳嗽和語(yǔ)言活動(dòng)以及候診室病人數(shù)量

大阪大學(xué)胡正濤博士(萬(wàn)偉偉老師團(tuán)隊(duì))為機(jī)器人開發(fā)通用工具解決復(fù)雜變種變量的操作任務(wù)

通過機(jī)械機(jī)構(gòu)實(shí)現(xiàn)機(jī)械手到工具的動(dòng)力傳遞,無需外部控制及供能,對(duì)機(jī)器人的避障路徑規(guī)劃影響極小

深度學(xué)習(xí)的可解釋性研究(三)——是誰(shuí)在撩動(dòng)琴弦

神經(jīng)網(wǎng)絡(luò)的敏感性分析方法可以分為變量敏感性分析、樣本敏感性分析兩種,變量敏感性分析用來檢驗(yàn)輸入屬性變量對(duì)模型的影響程度,樣本敏感性分析用來研究具體樣本對(duì)模型的重要程度

深度學(xué)習(xí)的可解釋性研究(二)——不如打開箱子看一看

神經(jīng)網(wǎng)絡(luò)模型本身其實(shí)并不是一個(gè)黑箱,其黑箱性在于我們沒辦法用人類可以理解的方式理解模型的具體含義和行為

深度學(xué)習(xí)的可解釋性研究(一)— 讓模型具備說人話的能力

為決策樹模型是一個(gè)具有比較好的可解釋性的模型,以決策樹為代表的規(guī)則模型在可解釋性研究方面起到了非常關(guān)鍵的作用

不完美場(chǎng)景下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法

騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員Louis在分享了自適應(yīng)缺陷數(shù)據(jù),業(yè)務(wù)場(chǎng)景下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機(jī)器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運(yùn)營(yíng)體系(ML0ps)實(shí)踐指
» 四驅(qū)四轉(zhuǎn)移動(dòng)機(jī)器人運(yùn)動(dòng)模型及應(yīng)用分析
» 國(guó)內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場(chǎng)景
» 國(guó)內(nèi)科技大廠布局生成式 AI,未來有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場(chǎng)景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場(chǎng)景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時(shí)更短 優(yōu)
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤(rùn)機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國(guó)運(yùn)營(yíng)中心:北京·清華科技園九號(hào)樓5層     中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728