www.第四色,熟女少妇色综合图区,日本sm/羞辱/调教/捆绑视频,网站国产,亚洲国产成人久久综合一区77

【財(cái)經(jīng)分析】打造細(xì)分領(lǐng)域數(shù)據(jù)優(yōu)勢(shì) 釋放行業(yè)版ChatGPT生產(chǎn)力

2023-04-27 17:38:31來源:新華財(cái)經(jīng)

新華財(cái)經(jīng)北京4月27日電(郭興華)426日,“企業(yè)數(shù)據(jù)精準(zhǔn)確權(quán)與AIGC全球合規(guī)論壇”在清華經(jīng)管學(xué)院舉辦。411日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》。47日,阿里系“通義千問”官宣內(nèi)測(cè),結(jié)合此前召開發(fā)布會(huì)的百度“文心一言”,我國(guó)多模態(tài)人工智能大模型開啟了追趕ChatGPT的競(jìng)賽。2022年底GhatGPT火速圈粉以來,大量資本和研發(fā)進(jìn)入這一賽道,人工智能的發(fā)展進(jìn)入百米沖刺的階段。OpenAI官方發(fā)文稱,集成算法、算力和預(yù)訓(xùn)練數(shù)據(jù)的AI模型即將進(jìn)入強(qiáng)人工智能時(shí)代,人類可能正面臨著有史以來最重大的一次生產(chǎn)力水平躍遷。盡管我國(guó)企業(yè)目前推出的GPT類產(chǎn)品在性能上與ChatGPT-4相比有不小的差距,但是我們?nèi)匀豢梢栽谝恍┓矫媾c之競(jìng)爭(zhēng),并非常有可能做的更好。

優(yōu)質(zhì)數(shù)據(jù)集的價(jià)值將越來越重要


【資料圖】

多模態(tài)人工智能大模型的開發(fā)工作主要涉及三個(gè)部分,算力、算法和投喂數(shù)據(jù)。根據(jù)OpenAI官方資料和專家分析,ChatGPT在算法方面的創(chuàng)新不多,目前的“驚艷”效果主要得益于算力的大幅提升和數(shù)據(jù)集的不斷完善。得益于AI賽道投入的增多和市場(chǎng)規(guī)模的擴(kuò)大,作為追趕者面臨的算力成本投入將呈現(xiàn)下降的趨勢(shì)。然而,優(yōu)質(zhì)數(shù)據(jù)集作為一種自帶版權(quán)和產(chǎn)權(quán)屬性的資產(chǎn),其使用成本并不一定會(huì)隨著時(shí)間的推移而下降。未來的如何構(gòu)建優(yōu)質(zhì)數(shù)據(jù)集共贏體系,為AI持續(xù)提供高質(zhì)量預(yù)訓(xùn)練數(shù)據(jù),將成為AI大模型競(jìng)爭(zhēng)的核心。

數(shù)據(jù)來源盡量廣泛。根據(jù)OpenAI官方公開的信息,GPT-3的預(yù)訓(xùn)練數(shù)據(jù)來源主要包括英文維基百科及其所有鏈接網(wǎng)頁、Common Crawl項(xiàng)目中的Web抓取數(shù)據(jù)、新聞文章、書籍、論文等文本資源以及其他公共語料庫(kù)和數(shù)據(jù)集。這些數(shù)據(jù)都是從互聯(lián)網(wǎng)上搜集而來的,以保證覆蓋面廣、樣本多樣化。

數(shù)據(jù)質(zhì)量要求較高。OpenAI團(tuán)隊(duì)指出,對(duì)大規(guī)模的自然語言處理預(yù)訓(xùn)練數(shù)據(jù),進(jìn)行篩選和清洗是非常重要的步驟,可以提高模型的訓(xùn)練效果和泛化能力。在預(yù)處理數(shù)據(jù)時(shí),需要去除文本中的噪聲、錯(cuò)誤數(shù)據(jù)和無用信息。為了避免偏見和不平衡的數(shù)據(jù)分布,需要對(duì)數(shù)據(jù)集進(jìn)行均衡和采樣。標(biāo)注和歸一化處理。標(biāo)注是將不同類型的文本數(shù)據(jù)進(jìn)行分類和標(biāo)記,以便進(jìn)行有監(jiān)督學(xué)習(xí)。歸一化則是將不同格式和語言的數(shù)據(jù)進(jìn)行相應(yīng)的轉(zhuǎn)換和統(tǒng)一。

清華大學(xué)技術(shù)創(chuàng)新研究中心數(shù)權(quán)經(jīng)濟(jì)研究室主任鐘宏表示,多模態(tài)人工智能大模型正以前所未有的進(jìn)化速度顛覆舊有模式,迅速催生了新業(yè)態(tài)、新技術(shù)和新的應(yīng)用。但是圍繞著數(shù)據(jù)安全、隱私保護(hù)和AI失控的一系列潛在風(fēng)險(xiǎn)成為了影響發(fā)展的關(guān)鍵問題。因此,全球急需共同構(gòu)建AIGC時(shí)代下的數(shù)字信任體系,為“數(shù)字智人”技術(shù)的發(fā)展、商業(yè)化的應(yīng)用和數(shù)字治理來建立規(guī)則。中國(guó)的大型科技企業(yè)需要廣泛接入數(shù)據(jù)資源來訓(xùn)練人工智能模型,大型央國(guó)企的數(shù)據(jù)資源如何去接入人工智能相關(guān)的服務(wù),這些問題給時(shí)代提出了全新的挑戰(zhàn)。為此,清華經(jīng)管學(xué)院、螞蟻集團(tuán)共同啟動(dòng)《共建數(shù)字信任體系服務(wù)科技創(chuàng)新生態(tài)高質(zhì)量發(fā)展研究》課題,依托清華在數(shù)據(jù)要素、數(shù)字商品、數(shù)字資產(chǎn)領(lǐng)域的智能確權(quán)與合規(guī)理論體系,發(fā)揮螞蟻集團(tuán)在區(qū)塊鏈、AI等數(shù)字智能科技優(yōu)勢(shì),聯(lián)合多方研究建立面向人工智能時(shí)代的數(shù)字信任體系,以推動(dòng)我國(guó)AIGC健康發(fā)展。

車聯(lián)網(wǎng)賽道,構(gòu)建面向自動(dòng)駕駛模型訓(xùn)練的共享大數(shù)據(jù)集

依托我國(guó)在新能源汽車產(chǎn)業(yè)的優(yōu)勢(shì),構(gòu)筑用于訓(xùn)練5G智能網(wǎng)聯(lián)車的“ChatGPT”數(shù)據(jù)集將是一個(gè)潛力巨大的投資賽道。在推動(dòng)汽車行業(yè)數(shù)據(jù)要素流通應(yīng)用的過程中,一直存在兩個(gè)難題。首先,數(shù)據(jù)所屬權(quán)難界定。當(dāng)同樣的數(shù)據(jù)被多次交易時(shí),如何充分保障數(shù)據(jù)擁有者、數(shù)據(jù)服務(wù)商、數(shù)據(jù)使用者的利益是存在難度的。其次,數(shù)據(jù)共享與隱私保護(hù)之間的矛盾突出。企業(yè)間的合作必然牽連到數(shù)據(jù)合作。如果對(duì)數(shù)據(jù)僅進(jìn)行脫敏處理,合作企業(yè)亦能通過數(shù)據(jù)的關(guān)聯(lián)性分析出用戶敏感信息,從而出現(xiàn)隱私風(fēng)險(xiǎn);如果企業(yè)對(duì)數(shù)據(jù)進(jìn)行過度處理,共享數(shù)據(jù)的實(shí)用價(jià)值就大大降低,制約了企業(yè)的深度合作和高速發(fā)展。

中汽創(chuàng)智科技有限公司CEO李豐軍表示,中汽創(chuàng)智牽頭,聯(lián)合中汽協(xié)、汽車企業(yè)和清華大學(xué)技術(shù)創(chuàng)新研究中心共同進(jìn)行《汽車行業(yè)數(shù)據(jù)確權(quán)與合規(guī)標(biāo)準(zhǔn)化》研究,希望以清華、DAMA等機(jī)構(gòu)專家在《企業(yè)數(shù)據(jù)確權(quán)與全球合規(guī)趨勢(shì)報(bào)告(2023)》中提出的“企業(yè)數(shù)據(jù)精準(zhǔn)確權(quán)”理論體系為基礎(chǔ),針對(duì)汽車行業(yè)建立有影響力的團(tuán)體標(biāo)準(zhǔn),解決汽車行業(yè)數(shù)字化、智能化發(fā)展過程中面臨的數(shù)據(jù)確權(quán)難、合規(guī)難等問題。中汽創(chuàng)智打造的“汽車大數(shù)據(jù)可信共享空間(車數(shù)空間)”按照“數(shù)據(jù)二十條”中“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的要求,基于股東方汽車企業(yè)沉淀的大量的車聯(lián)網(wǎng)數(shù)據(jù)和生態(tài)合作方的行業(yè)數(shù)據(jù),面向異業(yè)合作,實(shí)現(xiàn)了智能網(wǎng)聯(lián)汽車大數(shù)據(jù)在跨行業(yè)應(yīng)用場(chǎng)景中,向企業(yè)提供模型、核驗(yàn)等產(chǎn)品和服務(wù),并且包括用途可控可計(jì)量的數(shù)據(jù)共享流通服務(wù)。同時(shí),中汽創(chuàng)智正針對(duì)“自動(dòng)駕駛算法”這類需要大數(shù)據(jù)訓(xùn)練集進(jìn)行訓(xùn)練的人工智能產(chǎn)品,面向車企同業(yè)合作,探索車企間的數(shù)據(jù)聯(lián)盟,幫助各個(gè)車企建立起面向自動(dòng)駕駛模型訓(xùn)練的共享大數(shù)據(jù)集,助力車企自動(dòng)駕駛研發(fā),實(shí)現(xiàn)合作與共贏。

輔助診療賽道,AI大模型需要與傳統(tǒng)工具相結(jié)合

醫(yī)學(xué)是最早通過AI的方法來處理數(shù)據(jù),提高診斷準(zhǔn)確率的AI應(yīng)用領(lǐng)域之一?;卺t(yī)學(xué)領(lǐng)域的高質(zhì)量數(shù)據(jù),可以很好的釋放AI生產(chǎn)力,賦能醫(yī)學(xué)的相關(guān)領(lǐng)域,比如:在醫(yī)學(xué)研究方面,可以有效進(jìn)行疾病機(jī)制研究等;在臨床診療方面,可以有效輔助提升、規(guī)范診療措施,以及進(jìn)一步進(jìn)行個(gè)性化的精準(zhǔn)診療;在新藥研發(fā)方面,可以在靶標(biāo)發(fā)現(xiàn)、苗頭及先導(dǎo)化合物發(fā)現(xiàn)等方面有效輔助藥物研發(fā),大幅節(jié)省時(shí)間和經(jīng)費(fèi)。

然而,萬方醫(yī)學(xué)研究院院長(zhǎng)楊風(fēng)雷博士認(rèn)為,有效利用醫(yī)學(xué)數(shù)據(jù)前,需要解決一些問題,比如數(shù)據(jù)的確權(quán)問題,數(shù)據(jù)的權(quán)利方可能包括患者、醫(yī)生、醫(yī)院、政府等不同的相關(guān)方。這些數(shù)據(jù)的多維特征包括個(gè)人隱私和信息保護(hù)等問題。

楊風(fēng)雷表示,多模態(tài)人工智能大模型的性能總體上讓人刮目相看,有潛力解決醫(yī)學(xué)領(lǐng)域相當(dāng)多的問題。但是,它們也有一些不足,比如:一些答案中存在錯(cuò)誤;由于數(shù)據(jù)分布和不同提示產(chǎn)生回復(fù)隨機(jī)性等所帶來的輸出不一致;以及模型部署和資源消耗巨大等。這些問題,尤其是前兩個(gè)問題違背了醫(yī)學(xué)倫理,而這些不足卻是傳統(tǒng)的基于規(guī)則的AI輔助診療系統(tǒng)的優(yōu)勢(shì)。因此,考慮到醫(yī)學(xué)領(lǐng)域的安全要求高特點(diǎn),近期或者相當(dāng)長(zhǎng)一段時(shí)間內(nèi),結(jié)合各自優(yōu)勢(shì),采用新舊工具相結(jié)合的方式,可能是比較好的選擇。

數(shù)字經(jīng)濟(jì)學(xué)家陳曉華在接受采訪時(shí)表示,AI是新一輪科技革命和產(chǎn)業(yè)變革的引領(lǐng)者,也是數(shù)字經(jīng)濟(jì)時(shí)代持續(xù)賦能經(jīng)濟(jì)社會(huì)發(fā)展,推動(dòng)產(chǎn)業(yè)優(yōu)化的新動(dòng)能。在基礎(chǔ)設(shè)施層面,隨著東數(shù)西算工程的持續(xù)落地,我國(guó)算力供給格局將進(jìn)一步優(yōu)化,從而降低相關(guān)企業(yè)研發(fā)與運(yùn)營(yíng)的算力成本。從模型層與應(yīng)用層的角度來看,我國(guó)擁有海量的用戶群體與數(shù)據(jù)積累,一旦跨過商業(yè)化拐點(diǎn),各企業(yè)將加速融入此類技術(shù)并結(jié)合自身場(chǎng)景優(yōu)勢(shì)實(shí)現(xiàn)新一輪產(chǎn)業(yè)創(chuàng)新與升級(jí)。而從監(jiān)管和治理層面,國(guó)家網(wǎng)信辦首個(gè)AIGC監(jiān)管文件征求意見稿發(fā)布,意味著我國(guó)AI行業(yè)的標(biāo)準(zhǔn)化步伐正加速推進(jìn),未來我國(guó)AI產(chǎn)業(yè)生態(tài)將更加規(guī)范有序可持續(xù)發(fā)展。(郭興華,系中國(guó)經(jīng)濟(jì)信息社區(qū)塊鏈?zhǔn)紫治鰩煟?/p>

編輯:王春霞

關(guān)鍵詞:

責(zé)任編輯:孫知兵

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與太平洋財(cái)富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
如有問題,請(qǐng)聯(lián)系我們!

關(guān)于我們 - 聯(lián)系方式 - 版權(quán)聲明 - 招聘信息 - 友鏈交換 - 網(wǎng)站統(tǒng)計(jì)
 

太平洋財(cái)富主辦 版權(quán)所有:太平洋財(cái)富網(wǎng)

?中國(guó)互聯(lián)網(wǎng)違法和不良信息舉報(bào)中心中國(guó)互聯(lián)網(wǎng)違法和不良信息舉報(bào)中心

Copyright© 2012-2020 太平洋財(cái)富網(wǎng)(yuef.cn) All rights reserved.

未經(jīng)過本站允許 請(qǐng)勿將本站內(nèi)容傳播或復(fù)制 業(yè)務(wù)QQ:3 31 986 683