- +1
“大部分?jǐn)?shù)據(jù)仍沉睡在服務(wù)器,尚未轉(zhuǎn)化為真正的資產(chǎn)”
“過(guò)去很多年,我們?cè)跀?shù)據(jù)應(yīng)用方面仍停留在做一些漂亮的統(tǒng)計(jì)報(bào)表上,并沒(méi)有深挖數(shù)據(jù)內(nèi)在價(jià)值。大部分?jǐn)?shù)據(jù)仍沉睡在云端服務(wù)器上,并沒(méi)有轉(zhuǎn)化為企業(yè)真正的資產(chǎn)。”日前,在由上海復(fù)旦大學(xué)校友會(huì)創(chuàng)業(yè)創(chuàng)新俱樂(lè)部主辦的第四屆創(chuàng)業(yè)創(chuàng)新數(shù)字經(jīng)濟(jì)生態(tài)論壇上,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博導(dǎo)、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在主題演講過(guò)程中直言,當(dāng)前,數(shù)據(jù)價(jià)值變現(xiàn)也面臨諸多挑戰(zhàn)。

復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博導(dǎo)、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華
肖仰華認(rèn)為,造成這類(lèi)現(xiàn)象的困境有多層原因。現(xiàn)階段數(shù)據(jù)管理處于多主體狀態(tài),“今天可能在生產(chǎn)者手中,明天可能在采集者手中,之后會(huì)流通到加工者、使用者、運(yùn)營(yíng)者手中”,這種多方主體的狀態(tài),使得數(shù)據(jù)的確權(quán)和數(shù)據(jù)安全是否可控面臨較高要求。
此外,數(shù)據(jù)運(yùn)行的環(huán)境和生態(tài)也前所未有地復(fù)雜。肖仰華指出,數(shù)據(jù)運(yùn)行的形態(tài)極為多樣。數(shù)據(jù)可能運(yùn)行于傳統(tǒng)數(shù)據(jù)庫(kù)、關(guān)系數(shù)據(jù)庫(kù)、云數(shù)據(jù)庫(kù),也可能存在于文件中,甚至可能成為大模型的語(yǔ)料。
隨著數(shù)據(jù)管理的復(fù)雜性和多樣性增加,肖仰華稱(chēng),對(duì)企業(yè)發(fā)展統(tǒng)一、標(biāo)準(zhǔn)化的數(shù)據(jù)管理和操作方法也提出新需求。在數(shù)據(jù)價(jià)值變現(xiàn)層面上,如何喚醒、盤(pán)活“沉睡的數(shù)據(jù)”?
肖仰華認(rèn)為,人工智能時(shí)代,大模型有可能成為盤(pán)活沉睡數(shù)據(jù)資產(chǎn)的“利器”,大模型有利于將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價(jià)值。
肖仰華稱(chēng),大模型之所以被各行各業(yè)積極擁抱,是因?yàn)樗鼧O大地簡(jiǎn)化了傳統(tǒng)的商業(yè)變現(xiàn)流程。現(xiàn)在甲方只需提前提供數(shù)據(jù),大模型就能自動(dòng)從數(shù)據(jù)中學(xué)習(xí)到領(lǐng)域知識(shí)支撐下游應(yīng)用,從而形成商業(yè)價(jià)值,無(wú)需再與資產(chǎn)方進(jìn)行復(fù)雜的溝通,這種端到端的方式為商業(yè)應(yīng)用帶來(lái)了極大的便利。
此外,在多模態(tài)數(shù)據(jù)的統(tǒng)一價(jià)值變現(xiàn)上,以前收集到的數(shù)據(jù)庫(kù)服務(wù)器可能是文本格式、圖像格式,也可能是語(yǔ)音或表格,各類(lèi)各樣都有。但如今,只要將這些數(shù)據(jù)統(tǒng)一轉(zhuǎn)換成序列數(shù)據(jù),就可以通過(guò)大模型進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)價(jià)值變現(xiàn)方式。
不僅如此,大模型還在數(shù)據(jù)庫(kù)的智能化運(yùn)維方面發(fā)揮了重要作用。傳統(tǒng)數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)需要大量人力和資金投入運(yùn)營(yíng),而大模型的自動(dòng)化運(yùn)維能力可以顯著提高運(yùn)維效率,解放人力資源。
不過(guò),盡管大模型為釋放企業(yè)和各類(lèi)行業(yè)數(shù)據(jù)價(jià)值帶來(lái)了全新機(jī)遇,但仍面臨諸多挑戰(zhàn)。
肖仰華認(rèn)為,其中一個(gè)挑戰(zhàn)在于,目前的通用大模型以聊天或開(kāi)放性任務(wù)為主,仍存在“幻覺(jué)”現(xiàn)象、專(zhuān)業(yè)知識(shí)不足以及專(zhuān)業(yè)思維能力較弱等。還有大模型在可控性和編輯能力上較弱,無(wú)法實(shí)現(xiàn)像傳統(tǒng)數(shù)據(jù)庫(kù)那樣精準(zhǔn)地刪除或更新操作,這在行業(yè)應(yīng)用中帶來(lái)了較大的挑戰(zhàn)。
在私域數(shù)據(jù)和專(zhuān)業(yè)數(shù)據(jù)的理解上,大模型也有待提升。譬如,不同行業(yè)數(shù)據(jù)具有兩個(gè)基本特點(diǎn),其一是專(zhuān)業(yè)性強(qiáng),例如工業(yè)傳感器數(shù)據(jù),如果沒(méi)有專(zhuān)業(yè)背景知識(shí),很難理解數(shù)據(jù)背后的含義;其二是私域數(shù)據(jù)的表達(dá)有自身獨(dú)特性,例如不同數(shù)據(jù)庫(kù)中對(duì)“性別”的編碼可能截然不同(如0和1分別代表男和女),這類(lèi)私域數(shù)據(jù)編碼通用大模型能否直接理解,也是大模型在行業(yè)落地時(shí)需要解決的關(guān)鍵問(wèn)題。
肖仰華在演講中也提到,企業(yè)在利用大模型做數(shù)據(jù)處理與價(jià)值變現(xiàn)相關(guān)工作時(shí),也需關(guān)注成本問(wèn)題,“大模型的運(yùn)行存在成本,因此通常采用大模型蒸餾小模型的方式以降低成本。”大模型主要用于關(guān)鍵場(chǎng)合,或在小模型及人工難以處理的復(fù)雜場(chǎng)景中發(fā)揮作用,從而優(yōu)化整體方案的成本。
“我們相信,在大模型和人工智能技術(shù)的助力下,數(shù)據(jù)價(jià)值將很快被徹底激活。”肖仰華說(shuō)。





- 澎湃新聞微博
- 澎湃新聞公眾號(hào)
- 澎湃新聞抖音號(hào)
- IP SHANGHAI
- SIXTH TONE
- 報(bào)料熱線(xiàn): 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司