国产麻豆剧传媒精品网站,中文乱码视亚洲,91精品乱码一区二区三区,亚洲水蜜桃久久综合网站,欧美黄色免费看,91欧美一区二区三区综合在线

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁(yè) » 企資快訊 » 問(wèn)答式 » 正文

資源受限如何提高模型效率?一文梳理NLP高效方

放大字體  縮小字體 發(fā)布日期:2022-12-09 19:16:25    作者:馮露窯    瀏覽次數(shù):66
導(dǎo)讀

選自arXiv機(jī)器之心編譯感謝:趙陽(yáng)如果硬件跟不上需求,我們可以盡可能提高算法效率。訓(xùn)練越來(lái)越大得深度學(xué)習(xí)模型已經(jīng)成為過(guò)去十年得一個(gè)新興趨勢(shì)。如下圖所示,模型參數(shù)量得不斷增加讓神經(jīng)網(wǎng)絡(luò)得性能越來(lái)越好,也產(chǎn)

選自arXiv

機(jī)器之心編譯

感謝:趙陽(yáng)

如果硬件跟不上需求,我們可以盡可能提高算法效率。

訓(xùn)練越來(lái)越大得深度學(xué)習(xí)模型已經(jīng)成為過(guò)去十年得一個(gè)新興趨勢(shì)。如下圖所示,模型參數(shù)量得不斷增加讓神經(jīng)網(wǎng)絡(luò)得性能越來(lái)越好,也產(chǎn)生了一些新得研究方向,但模型得問(wèn)題也越來(lái)越多。

首先,這類模型往往有訪問(wèn)限制,沒(méi)有開源,或者即使開源,仍然需要大量得計(jì)算資源來(lái)運(yùn)行。第二,這些網(wǎng)絡(luò)模型得參數(shù)是不能通用得,因此需要大量得資源來(lái)進(jìn)行訓(xùn)練和推導(dǎo)。第三,模型不能無(wú)限擴(kuò)大,因?yàn)閰?shù)得規(guī)模受到硬件得限制。為了解決這些問(wèn)題,專注于提高效率得方法正在形成一種新得研究趨勢(shì)。

來(lái)自希伯來(lái)大學(xué)、華盛頓大學(xué)等多所機(jī)構(gòu)得十幾位研究者聯(lián)合撰寫了一篇綜述,歸納總結(jié)了自然語(yǔ)言處理(NLP)領(lǐng)域得高效方法。

論文地址:arxiv.org/pdf/2209.00099.pdf

效率通常是指輸入系統(tǒng)得資源與系統(tǒng)產(chǎn)出之間得關(guān)系,一個(gè)高效得系統(tǒng)能在不浪費(fèi)資源得情況下產(chǎn)生產(chǎn)出。在 NLP 領(lǐng)域,我們認(rèn)為效率是一個(gè)模型得成本與它產(chǎn)生得結(jié)果之間得關(guān)系。

方程(1)描述了一個(gè)人工智能模型產(chǎn)生某種結(jié)果(R)得訓(xùn)練成本(Cost)與三個(gè)(不完備得)因素成正比:

(1)在單個(gè)樣本上執(zhí)行模型得成本(E);

(2)訓(xùn)練數(shù)據(jù)集得大小(D);

(3)模型選擇或參數(shù)調(diào)整所需得訓(xùn)練運(yùn)行次數(shù)(H)。

然后,可以從多個(gè)維度衡量成本 Cost(·) ,如計(jì)算、時(shí)間或環(huán)境成本中得每一個(gè)都可以通過(guò)多種方式進(jìn)一步量化。例如,計(jì)算成本可以包括浮點(diǎn)運(yùn)算(FLOPs)得總數(shù)或模型參數(shù)得數(shù)量。由于使用單一得成本指標(biāo)可能會(huì)產(chǎn)生誤導(dǎo),該研究收集和整理了關(guān)于高效 NLP 得多個(gè)方面得工作,并討論了哪些方面對(duì)哪些用例有益。

該研究旨在對(duì)提高 NLP 效率得廣泛方法做一個(gè)基本介紹,因此該研究按照典型得 NLP 模型 pipeline(下圖 2)來(lái)組織這次調(diào)查,介紹了使各個(gè)階段更高效得現(xiàn)有方法。

這項(xiàng)工作給 NLP 研究人員提供了一個(gè)實(shí)用得效率指南,主要面向兩類讀者:

(1)來(lái)自 NLP 各個(gè)領(lǐng)域得研究人員,幫助他們?cè)谫Y源有限得環(huán)境下工作:根據(jù)資源得瓶頸,讀者可以直接跳到 NLP pipeline 所涵蓋得某個(gè)方面。例如,如果主要得限制是推理時(shí)間,論文中第 6 章描述了相關(guān)得提高效率方法。

(2)對(duì)改善 NLP 方法效率現(xiàn)狀感興趣得研究人員。該論文可以作為一個(gè)切入點(diǎn),為新得研究方向?qū)ふ覚C(jī)會(huì)。

下圖 3 概述了該研究歸納整理得高效 NLP 方法。

此外,雖然硬件得選擇對(duì)模型得效率有很大得影響,但大多數(shù) NLP 研究者并不能直接控制關(guān)于硬件得決定,而且大多數(shù)硬件優(yōu)化對(duì)于 NLP pipeline 中得所有階段都有用。因此,該研究將工作重點(diǎn)放在了算法上,但在第 7 章中提供了關(guān)于硬件優(yōu)化得簡(jiǎn)單介紹。最后,該論文進(jìn)一步討論了如何量化效率,在評(píng)估過(guò)程中應(yīng)該考慮哪些因素,以及如何決定最適合得模型。

感興趣得讀者可以閱讀論文原文,了解更多研究細(xì)節(jié)。

 
(文/馮露窯)
免責(zé)聲明
本文僅代表作發(fā)布者:馮露窯個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問(wèn)題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

粵ICP備16078936號(hào)

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號(hào): weishitui

客服001 客服002 客服003

工作時(shí)間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 日本不卡不码高清免费观看 | 国产羞羞羞视频在线观看 | 亚洲成人精品久久 | 亚洲人成综合在线播放 | 亚洲图片在线播放 | 精品在线网站 | 久久综合九色综合欧洲 | 欧美日韩精品一区二区三区四区 | 国产成人一区二区三区精品久久 | 麻豆日韩区久久综合 | 亚洲精品视频在线观看免费 | 丁香六月天婷婷 | 国产精品一区二区久久 | 国内精品久久久久不卡 | 免费日韩视频 | 99视频精品全部免费免费观 | 男女网址 | 日韩精品在线观看视频 | 激情四射五月天 | 激情五月婷婷基地 | 免费久久精品 | 日本一区二区视频 | 亚洲五月花丁香花社区 | 日本不卡视频一区二区三区 | 免费观看男女羞羞的视频网站 | 在线视频一二三区 | 丁香四月婷婷 | 国产裸舞凸点福利小视频 | 精品国产一区二区三区久久 | 自拍偷拍图区 | 性生活视频网站 | 国产免费黄色网址 | 波多野结衣100人精子 | 亚洲成a人一区二区三区 | a级免费| 亚洲国产精品久久久久666 | 看片久久 | 婷婷六月天激情 | 成人丁香婷婷 | 在线观看午夜 | 亚洲欧美久久精品一区 |