大模型既要“吃得飽”更要“吃得好”
這些人工智能(AI)生成的“胡言亂語(yǔ)”雖是網(wǎng)友們茶余飯后的笑談,但提醒我們要清醒認(rèn)識(shí)到其背后折射出的問(wèn)題:數(shù)據(jù)質(zhì)量是大模型應(yīng)用成敗的關(guān)鍵。以個(gè)性化推薦AI系統(tǒng)為例,一些企業(yè)在開(kāi)發(fā)過(guò)程中,雖然收集了大量的用戶行為數(shù)據(jù),但數(shù)據(jù)中充斥著錯(cuò)誤的標(biāo)注、重復(fù)的數(shù)據(jù)以及相互矛盾的信息,數(shù)據(jù)的量增加了,但系統(tǒng)推薦的準(zhǔn)確性并沒(méi)有顯著提升。《自然》雜志(Nature)刊登的一篇有關(guān)大模型可靠性研究的文章指出,一個(gè)西班牙研究團(tuán)隊(duì)發(fā)現(xiàn),包括OpenAI公司的GPT在內(nèi)的幾個(gè)大模型升級(jí)后,雖然參數(shù)量更大了,誤答情況卻更嚴(yán)重了。因此,大模型長(zhǎng)得壯不壯,不僅取決于“食量”(即數(shù)據(jù)的數(shù)量),更在于食物的“質(zhì)量”(即數(shù)據(jù)的質(zhì)量)——吃得飽并不等同于吃得好。
數(shù)據(jù)是大模型的基石,在數(shù)據(jù)質(zhì)量不高、可靠性缺失的情況下,一味追求大模型參數(shù)量的增加,不僅無(wú)法提升模型性能,反而會(huì)放大偏差和謬誤,產(chǎn)生更多不可信數(shù)據(jù)。如此一來(lái),勢(shì)必造成計(jì)算與存儲(chǔ)資源的浪費(fèi),增加開(kāi)發(fā)和維護(hù)成本,降低用戶信任度。更為嚴(yán)重的是,這種“大模型幻覺(jué)”和“災(zāi)難性遺忘”現(xiàn)象如果發(fā)生在精確性要求極高的工業(yè)生產(chǎn)領(lǐng)域中,還可能引發(fā)不可預(yù)測(cè)的風(fēng)險(xiǎn)和隱患。以油氣勘探為例,基于大模型給出的錯(cuò)誤預(yù)測(cè)進(jìn)行開(kāi)采可能導(dǎo)致數(shù)億元的資金損失,并對(duì)自然環(huán)境造成不可逆轉(zhuǎn)的破壞。
提升大模型性能,關(guān)鍵是處理好數(shù)據(jù)“質(zhì)”和“量”的關(guān)系,構(gòu)建大規(guī)模、高質(zhì)量的數(shù)據(jù)集。應(yīng)建立完善的數(shù)據(jù)收集、清洗、驗(yàn)證和存儲(chǔ)機(jī)制,加強(qiáng)對(duì)數(shù)據(jù)質(zhì)量的監(jiān)控和評(píng)估,確保數(shù)據(jù)的準(zhǔn)確性、完整性和一致性。此外,還應(yīng)注重跨領(lǐng)域合作,引入數(shù)據(jù)科學(xué)家、AI算法工程師等多方力量,開(kāi)展大模型算法合作、制定數(shù)據(jù)共享和隱私安全保密協(xié)議,推動(dòng)大模型產(chǎn)學(xué)研用生態(tài)建設(shè)。
如今,大模型的發(fā)展已邁入多模態(tài)融合階段。通過(guò)加強(qiáng)數(shù)據(jù)治理,優(yōu)化人工智能學(xué)習(xí)、訓(xùn)練和驗(yàn)證的“基礎(chǔ)食材”,端上大規(guī)模、高質(zhì)量、多模態(tài)數(shù)據(jù)集的“豐盛大餐”,必將助力大模型能力的提升,讓人工智能更好地賦能千行百業(yè)、造福人類社會(huì)。
標(biāo)簽:
搶先讀
- 大模型既要“吃得飽”更要“吃得好”
- 大語(yǔ)言模型意識(shí)水平測(cè)評(píng)報(bào)告顯示:DeepSeek-R1語(yǔ)義一致性表現(xiàn)較好
- 大語(yǔ)言模型意識(shí)水平測(cè)評(píng)報(bào)告顯示:DeepSeek-R1語(yǔ)義一致性表現(xiàn)較好
- 黃東紅委員:多舉措推動(dòng)長(zhǎng)期護(hù)理保險(xiǎn)可持續(xù)發(fā)展
- 體驗(yàn)別樣藏歷新年:入藏家、品美食、賞非遺
- “乳兒班”來(lái)了,雙職工家庭的育兒壓力減輕了嗎?
- 云南適合帶孩子去旅游的地方有哪些?去云南旅游一周大概需要多少錢?
- 中國(guó)一汽首席技能大師楊永修:支持高技能人才提升學(xué)歷為技術(shù)創(chuàng)新添智
- (神州寫真)空中看花、舌尖品花 中國(guó)多地賞春潮起
- 呂愛(ài)輝委員:新科技與文旅成吉林畜牧業(yè)質(zhì)變兩大法寶
- 朔的意思是什么怎么解釋?古代朔望是什么意思?
- 國(guó)產(chǎn)電影成文旅熱潮“催化劑” 春日旅游升級(jí)“新玩法”
- 2025年CBA全明星賽北區(qū)隊(duì)取勝 鄒雨宸榮膺M(jìn)VP
- 小模型打敗大模型?患者挑戰(zhàn)專家?醫(yī)療AI需要冷思考
- 深圳發(fā)布三個(gè)工作方案 全力培育優(yōu)良營(yíng)商環(huán)境
- 八旬聽(tīng)障老人首次乘高鐵,準(zhǔn)“00后”列車員們細(xì)心照料
- 八旬聽(tīng)障老人首次乘高鐵,準(zhǔn)“00后”列車員們細(xì)心照料
- 深圳發(fā)布三個(gè)工作方案 全力培育優(yōu)良營(yíng)商環(huán)境
- 青島孩子玩的地方有哪些?青島一日游方案是什么?
- 3月3日人民幣對(duì)美元中間價(jià)報(bào)7.1745元 下調(diào)7個(gè)基點(diǎn)
- 3月3日人民幣對(duì)美元中間價(jià)報(bào)7.1745元 下調(diào)7個(gè)基點(diǎn)
- 小模型打敗大模型?患者挑戰(zhàn)專家?醫(yī)療AI需要冷思考
- 深圳發(fā)布三個(gè)工作方案 全力培育優(yōu)良營(yíng)商環(huán)境
- 中國(guó)“土豬”從瀕臨滅絕到搖身變“金豬”
- 大數(shù)據(jù)、傳感器、拍片“體檢” “科技+農(nóng)業(yè)”深度融合 繪出田野好“豐”景
- 河套春耕新景:智慧大棚育四季豐收 科技治堿造萬(wàn)畝良田
- 20余家泰國(guó)旅行商考察壯鄉(xiāng)旅游資源 冀深化文旅合作
- 大數(shù)據(jù)、傳感器、拍片“體檢” “科技+農(nóng)業(yè)”深度融合 繪出田野好“豐”景
- 2025年浙江(杭州)國(guó)際時(shí)尚體育周將啟 黃雅瓊、王昶助陣
- 土豆巧變米 中國(guó)首條自主研發(fā)“土豆米”生產(chǎn)線云南昭通投產(chǎn)
- “老牌民企”的科技創(chuàng)新路 葛炳灶:產(chǎn)品競(jìng)爭(zhēng)力是最大底氣
- 蘇圓圓代表:推動(dòng)電氫協(xié)同產(chǎn)業(yè)步入“快車道”
- “老牌民企”的科技創(chuàng)新路 葛炳灶:產(chǎn)品競(jìng)爭(zhēng)力是最大底氣
- “同心之旅 復(fù)興有我”系列活動(dòng)開(kāi)啟第六站 網(wǎng)絡(luò)大V與周鴻祎共探AI和網(wǎng)絡(luò)安全
- 蘇圓圓代表:推動(dòng)電氫協(xié)同產(chǎn)業(yè)步入“快車道”
- 舊手機(jī)煥發(fā)新價(jià)值!這些“新選擇”讓你的廢舊手機(jī)變廢為寶
- 2025中國(guó)生物發(fā)酵產(chǎn)業(yè)技術(shù)大會(huì)舉辦 業(yè)內(nèi)熱議AI接入生物制造
- (走進(jìn)中國(guó)鄉(xiāng)村)廣東百年“漁網(wǎng)小鎮(zhèn)”謀新機(jī):一張漁網(wǎng)撒向世界
- 黃瑋委員:守護(hù)邊疆文化、助力家鄉(xiāng)繁榮的“逐夢(mèng)人”
- 謝延翠代表:為低空經(jīng)濟(jì)“探路”
- 什么是權(quán)重股票類別?股市中什么叫托單?
- 中級(jí)行情具有怎樣的特征?中級(jí)行情一般多大漲幅?
- 中國(guó)將增加對(duì)民營(yíng)和小微企業(yè)信貸投放
- 聚焦課堂共成長(zhǎng) 專家入校促提升 ——駐馬店市驛城區(qū)教育教學(xué)研究中心教研員走進(jìn)市第三中學(xué)聽(tīng)課指導(dǎo)
- 五部門聯(lián)合召開(kāi)金融支持民營(yíng)企業(yè)高質(zhì)量發(fā)展座談會(huì)
- 五部門聯(lián)合召開(kāi)金融支持民營(yíng)企業(yè)高質(zhì)量發(fā)展座談會(huì)
- 喜馬拉雅app怎么改名字?喜馬拉雅音頻怎么導(dǎo)出mp3?
- “北京中軸線無(wú)障礙支付服務(wù)旅游示范區(qū)”建設(shè)啟動(dòng)
- 遼寧省與中央企業(yè)深化合作座談會(huì)在北京舉行
- 讓“正能量”與“大流量”相遇!專家學(xué)者共話科普
- 書(shū)房照明要注意什么?書(shū)房照明需要三色燈嗎?
- 北京亦莊發(fā)布超萬(wàn)個(gè)機(jī)器人“崗位”
- 嚴(yán)格規(guī)范汽車動(dòng)力電池回收
- 國(guó)際金價(jià)本周累計(jì)跌近3%
- 市場(chǎng)監(jiān)管總局近期對(duì)網(wǎng)售產(chǎn)品進(jìn)行質(zhì)量國(guó)家監(jiān)督抽查 通報(bào)來(lái)了!
- 瀘州老窖封藏盛典煥新表達(dá) 致敬濃香出海110周年
- “職普分流”焦慮如何解?甘肅酒泉探“雙融通”職教體系
- 2025年大學(xué)生志愿服務(wù)西部計(jì)劃報(bào)名通道開(kāi)啟 報(bào)名方式→
- 2025年大學(xué)生志愿服務(wù)西部計(jì)劃報(bào)名通道開(kāi)啟 報(bào)名方式→
- 藍(lán)皮書(shū):AI技術(shù)正重構(gòu)歷史地理等學(xué)科傳統(tǒng)研究方法
- 國(guó)家醫(yī)保局印發(fā)《呼吸系統(tǒng)醫(yī)療服務(wù)價(jià)格項(xiàng)目立項(xiàng)指南(試行)》
- “一帶一路”眼健康聯(lián)盟在上海成立
- 球員可自薦參與足協(xié)選拔 中國(guó)足協(xié)球員自薦系統(tǒng)今日上線
- 中國(guó)足協(xié)發(fā)布“中國(guó)足協(xié)球員自薦系統(tǒng)” 自薦、選拔如何進(jìn)行?
- 第二屆上海合作組織雪地足球賽哈爾濱開(kāi)賽
- “巫師”希金斯奪2025斯諾克世界公開(kāi)賽冠軍
- 中國(guó)足協(xié)發(fā)布“中國(guó)足協(xié)球員自薦系統(tǒng)” 自薦、選拔如何進(jìn)行?
- 第二屆上海合作組織雪地足球賽開(kāi)賽 揭幕戰(zhàn)中國(guó)隊(duì)勝出
- 速度滑冰世界杯荷蘭站:韓梅再摘一銅
- 《哪吒2》票房超過(guò)所有單一超級(jí)英雄片
- 冰不導(dǎo)電、眼淚倒流……《哪吒2》隱藏的物理學(xué),你看懂了嗎?
- 再創(chuàng)紀(jì)錄!《哪吒2》進(jìn)入全球票房榜前7名
- 意大利導(dǎo)演點(diǎn)贊《哪吒2》:情感表達(dá)細(xì)膩 特效制作美術(shù)設(shè)計(jì)令人驚嘆
- 四件非遺作品被認(rèn)定為北京傳統(tǒng)工藝美術(shù)珍品
- 2月總票房160.83億!刷新中國(guó)影史單月大盤票房、人次紀(jì)錄
- 下一個(gè)大動(dòng)作!《哪吒2》出品方與總臺(tái)央視頻聯(lián)合打造動(dòng)畫電影《紅樓夢(mèng)》
- “謝曉澤新作展——?dú)v史的琥珀:敦煌藏經(jīng)洞再想象”啟幕
- “閩樂(lè)芳華杯”民族器樂(lè)大賽啟幕 為民樂(lè)新星崛起吹響“集結(jié)號(hào)”
- 從皮洛遺址到濛溪河遺址 鄭喆軒:向泥土和石頭叩問(wèn)遠(yuǎn)古文明答案
- 記者跟著小哥送外賣,體驗(yàn)他們爭(zhēng)分奪秒、穿街過(guò)巷的冷暖日常
- 周琪代表:以務(wù)實(shí)態(tài)度促兩岸同胞心靈契合
- 郭文標(biāo):“海上守護(hù)神”逐浪43載
- 盛弘代表:“平底鞋”走社區(qū) 希望讓“煙火氣”點(diǎn)燃消費(fèi)
- 盛弘代表:“平底鞋”走社區(qū) 希望讓“煙火氣”點(diǎn)燃消費(fèi)
- 郭文標(biāo):“海上守護(hù)神”逐浪43載
- 大型話劇《三家巷》在惠州演出
- “微笑北京”志愿服務(wù)品牌計(jì)劃發(fā)布
- 福建建陽(yáng):科技助力高標(biāo)準(zhǔn)農(nóng)田油菜春管
- “乾坤灣”命名者張士元:解碼二月二“龍?zhí)ь^”的文化基因
- “何以上?!ぶ驹谏虾!睂?duì)話講壇啟動(dòng) 首場(chǎng)揭秘外灘老市府
- 山東迎近年來(lái)最大規(guī)模歐洲入境旅游團(tuán)
- AG600“鯤龍”完成全部取證試飛科目
- 看病取消門診預(yù)交金,意味著什么?
- 覓古籍之美 聞香識(shí)敦煌 外國(guó)留學(xué)生等在上海感受千年文脈
- 星月神話開(kāi)啟3月天象劇場(chǎng),有望看到土星光環(huán)“消失”
- 2025年1月中國(guó)外匯市場(chǎng)總計(jì)成交22.34萬(wàn)億元人民幣
- 2024年我國(guó)新批準(zhǔn)發(fā)布104項(xiàng)食品安全領(lǐng)域國(guó)家標(biāo)準(zhǔn)物質(zhì)
- 證監(jiān)會(huì):目前暫不具備條件設(shè)立重慶證券交易所
- 東西問(wèn)丨譚佳:蛇神話如何成為跨越東西方的文化符號(hào)?
- 受雨雪大霧天氣影響 全國(guó)公路這些路段出行請(qǐng)注意!