算力不足限制AI創(chuàng)新 學(xué)者呼吁加強學(xué)術(shù)界算力支持
相關(guān)研究論文已于近日發(fā)布在預(yù)印本服務(wù)器arXiv上,指出學(xué)者難以接觸到最先進的計算系統(tǒng),這可能阻礙他們開發(fā)大型語言模型(LLM)和其他AI研究的進展。
(圖片來源:nature)
具體而言,學(xué)術(shù)研究者往往沒有資源獲取足夠強大的圖形處理器(GPU)——這些電腦芯片常用于訓(xùn)練AI模型,且價格昂貴,可達數(shù)千美元。相比之下,大型科技公司的研究者預(yù)算更高,可以在GPU上投入更多資金。“每增加一塊GPU,就能提升更多算力。”美國布朗大學(xué)計算機科學(xué)家、該研究的合著者Apoorv Khandelwal表示,“雖然行業(yè)巨頭可能擁有數(shù)千塊GPU,但學(xué)者可能只有幾塊。”
“學(xué)術(shù)界與行業(yè)界的模型差距巨大,但本可以小得多。”美國華盛頓特區(qū)非營利AI研究機構(gòu)EleutherAI的執(zhí)行董事Stella Biderman說。她表示,對這一差距的研究“至關(guān)重要”。
為了評估學(xué)者可用的計算資源,研究團隊對35家機構(gòu)的50名科學(xué)家進行了調(diào)查。受訪者中,66%對自己的算力滿意度打了3分及以下(滿分5分)。“他們根本不滿意。”Khandelwal說。
各大學(xué)在GPU訪問設(shè)置上有所不同。有些學(xué)校設(shè)有供各部門和學(xué)生共享的中央計算集群,研究人員可申請GPU使用時間。另一些機構(gòu)可能為實驗室成員直接購買機器。
柱狀圖揭示了調(diào)查的結(jié)果:學(xué)者通常只能有限地訪問圖形處理器,這進而限制了他們訓(xùn)練機器學(xué)習(xí)模型的能力。
一些科學(xué)家表示,他們不得不等待數(shù)天才能使用GPU,并指出在項目截止日期前后等待時間特別長。調(diào)查結(jié)果還凸顯了全球算力訪問的差異。例如,有受訪者提到在中東地區(qū)難以找到GPU。僅有10%的受訪者表示,他們可以使用英偉達的H100GPU,這是專為AI研究設(shè)計的高端芯片。
這一障礙極大地加劇了預(yù)訓(xùn)練過程的難度,即向大型語言模型(LLM)輸入海量數(shù)據(jù)集的過程變得尤為困難。“由于成本高昂,大多數(shù)學(xué)者甚至不敢涉足預(yù)訓(xùn)練領(lǐng)域的研究。”Khandelwal指出。他和同事堅信,學(xué)者在人工智能研究中帶來了獨一無二的視角,而算力的匱乏可能會嚴重制約這一領(lǐng)域的未來發(fā)展。
“為了長期的增長和技術(shù)發(fā)展,擁有一個健康、有競爭力的學(xué)術(shù)研究環(huán)境至關(guān)重要。”美國布朗大學(xué)計算機科學(xué)和語言學(xué)學(xué)者、該研究的合著者Ellie Pavlick說,“相比之下,在行業(yè)研究中往往存在顯著的商業(yè)壓力,這有時會促使研究人員急于求成,減少了對未知領(lǐng)域的探索。”
研究人員還深入探究了學(xué)者如何在算力資源有限的情況下更高效地進行利用。他們測算了在使用1至8塊GPU的低資源硬件環(huán)境下,預(yù)訓(xùn)練多個大型語言模型(LLM)所需的時間。盡管面臨資源限制,學(xué)者仍成功訓(xùn)練出多個模型,但這一過程耗時更長,并要求他們必須采用更為高效的方法。
“我們實際上可以延長現(xiàn)有GPU的使用時間,從而在一定程度上彌補與行業(yè)界的差距。”Khandelwal說。
“在有限的計算資源上竟然也能訓(xùn)練出比許多人預(yù)期中更大的模型,這確實令人驚嘆。”德國薩爾布呂肯薩爾蘭大學(xué)神經(jīng)顯式模型研究者Ji-Ung Lee表示。他進一步指出,未來的研究可以聚焦小公司行業(yè)研究者的經(jīng)歷,因為他們同樣在計算資源獲取上面臨困境。“并非所有有能力獲取無限算力的人都能夠如愿以償。”他補充道。
關(guān)鍵詞:
責(zé)任編輯:孫知兵
免責(zé)聲明:本文僅代表作者個人觀點,與太平洋財富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
如有問題,請聯(lián)系我們!
- 算力不足限制AI創(chuàng)新 學(xué)者呼吁加強學(xué)術(shù)界算2024-11-28
- AI數(shù)據(jù)中心需求激增 電網(wǎng)基礎(chǔ)設(shè)施面臨挑戰(zhàn)2024-11-28
- 中國科學(xué)院報告研判125個科學(xué)研究前沿2024-11-28
- 2024世界公眾科學(xué)素質(zhì)促進大會將聚焦全球公2024-11-28
- 我國科研人員首次實現(xiàn)像素“分割”成像2024-11-28
- 朱雀二號改進型遙一運載火箭發(fā)射成功2024-11-28
- 向“新”提“智” 先進制造業(yè)“鏈”上謀機2024-11-28
- 游玉律,尋古跡!傳承玉律文化,再譜盛世華2024-11-28
- 浙江「新質(zhì)生產(chǎn)力」科普指引——向新向質(zhì)向2024-11-28
- 法行寶愛企查“新員工”上崗,度律度秘線上2024-11-28
- KCM Trade贊助并出席澳大利亞Finance Mag2024-11-28
- 和府撈面:透明經(jīng)營,用信任贏得市場“生機2024-11-28
- 順豐控股登陸港交所 物流行業(yè)首家A+H公司2024-11-28
- 來罐戰(zhàn)馬能量飲料,讓踏秋徒步更有能量2024-11-28
- 成都御生堂創(chuàng)新晚期腫瘤治則廣獲肯定與好評2024-11-28
- 北新防水嚴防不合格產(chǎn)品,多措并舉保障質(zhì)量2024-11-28
- 恒小花:引領(lǐng)未來人工智能創(chuàng)新無限可能2024-11-28
- 三季報行情顯現(xiàn)行業(yè)機會,湖南金證助力理性2024-11-28
- 北新防水榮獲雙高星級耐老化認證力克不合格2024-11-28
- 恒昌公益兒童腸道重疾救助項目榮登《人民網(wǎng)2024-11-28
- 羽毛球 “燃” 動市場,東鵬補水啦錨定熱2024-11-28
- 中工國際:簽署秦皇島污水處理協(xié)議 深化“2024-11-28
- 存量為王 場景制勝 萬恒科技助力數(shù)字金融2024-11-28
- 榮登新華社榜單!TCL光伏科技項目入選“年2024-11-28
- 中聚企服企業(yè)專利申請全攻略:用專利提升品2024-11-28
- 盛健羊乳集團2025年客戶大會將在內(nèi)蒙古召開2024-11-28
- 吃個飯、理個發(fā)、健個身,咋就成了直播間“2024-11-28
- 無界 無限 | 星邦智能攜行業(yè)全方位解決2024-11-28
- Advanced Medical參加?xùn)|京AMWC JAPAN 202024-11-28
- 中信建投張青:從金融巨擘到公益大使的蛻變2024-11-28
精彩推薦
- 護航年末流動性 降準蓄勢待發(fā)
- 千億資金翻涌 信托公司能否成為綠色金...
- 市值管理新規(guī)推動估值重塑 央國企或成主導(dǎo)
- 央行連續(xù)操作注入流動性 降準預(yù)期再升溫
- 小黃象攜手中國國家U18冰球隊,以熱愛書...
- 北京花卉交易中心豐富市民“花樣”生活
- 南漳柑橘“致富經(jīng)”:高山盆地“金果”...
- 市場監(jiān)管總局:推動平臺企業(yè)和平臺內(nèi)商...
- 遇見非遺丨把沉睡的泥土鐫刻進生活
- “江南蔬菜之鄉(xiāng)”江西樂平3000余畝水芹...
- 襄陽牛肉面:“熱辣滾燙”顯“俠義”
- 【百萬莊小課堂】今天你emo了嗎?職場青...
- 中國試點開放信用監(jiān)管數(shù)據(jù) 便利境外來...
- 深圳年度最大規(guī)模畢業(yè)生雙選會提供崗位3...
- 廣西桂林滿城桂花飄香