YouTube視頻被OpenAI用來訓(xùn)練大模型？CEO稱暫無證據(jù)，但此舉違規(guī)

澎湃新聞?dòng)浾?吳遇利

2024-04-07 15:08

來源：澎湃新聞

? 10%公司 >

YouTube CEO警告OpenAI 澎湃新聞編輯李垚瑞(01:48)

人工智能頭部企業(yè)OpenAI可以使用哪些數(shù)據(jù)來訓(xùn)練模型，再次引發(fā)公開爭(zhēng)論。

當(dāng)?shù)貢r(shí)間4月5日，視頻網(wǎng)站YouTube首席執(zhí)行官尼爾·莫漢（Neal Mohan）在采訪中表示，他并沒有直接證據(jù)能夠證明OpenAI確實(shí)使用了YouTube的視頻來完善其文生視頻AI工具Sora，如果真的使用了，那就“明顯違反”了YouTube平臺(tái)的使用條款。

莫漢表示：“從創(chuàng)作者的角度來看，當(dāng)創(chuàng)作者將他們的辛勤勞動(dòng)上傳到我們的平臺(tái)時(shí)，他們有一定的期望。其中之一就是符合YouTube的服務(wù)條款，不允許下載文字或視頻片段等內(nèi)容。這（OpenAI使用YouTube視頻）明顯違反了我們的服務(wù)條款?！?/p>

此外，莫漢還在采訪中提到，谷歌確實(shí)使用了YouTube上的一些內(nèi)容訓(xùn)練旗下大模型Gemini，但在使用這些內(nèi)容之前，已經(jīng)得到了創(chuàng)作者的授權(quán)，并遵循了YouTube與創(chuàng)作者之間的合同。

近日，《紐約時(shí)報(bào)》報(bào)道，OpenAI和谷歌涉嫌使用YouTube視頻的轉(zhuǎn)錄文本來訓(xùn)練其人工智能模型，這一行為可能侵犯了YouTube創(chuàng)作者的版權(quán)。報(bào)道稱，OpenAI通過使用其Whisper語(yǔ)音識(shí)別工具，轉(zhuǎn)錄了超過一百萬小時(shí)的YouTube視頻內(nèi)容，并將這些數(shù)據(jù)用于訓(xùn)練模型。

OpenAI的Sora是一種文生視頻工具，能夠一次生成整個(gè)視頻或擴(kuò)展生成的視頻以使其更長(zhǎng)。和其他生成式AI工具的工作原理一樣，Sora也是從網(wǎng)絡(luò)上吸收各種內(nèi)容，并使用這些數(shù)據(jù)作為生成新內(nèi)容的基礎(chǔ)，包括視頻、照片、敘述文本等。

AI的強(qiáng)大功能建立在大量數(shù)據(jù)訓(xùn)練的基礎(chǔ)之上，隨著OpenAI、谷歌和其他公司競(jìng)相開發(fā)更強(qiáng)大的AI工具，他們正在尋求越來越多的數(shù)據(jù)來訓(xùn)練模型，以生成更好的結(jié)果。

但這已經(jīng)引發(fā)了人們對(duì)數(shù)據(jù)來源、用途的質(zhì)疑。此前，OpenAI因其訓(xùn)練模型的內(nèi)容來源而被《紐約時(shí)報(bào)》以及一些出版社和作者起訴。

今年1月，《紐約時(shí)報(bào)》在紐約南區(qū)法院向OpenAI及其投資人微軟公司提起侵犯版權(quán)訴訟，指控二者未經(jīng)許可使用其數(shù)百萬篇文章以訓(xùn)練人工智能模型，而這些聊天機(jī)器人現(xiàn)在與該新聞機(jī)構(gòu)形成競(jìng)爭(zhēng)，成為可靠的信息來源。

訴訟稱，被告應(yīng)對(duì)與“非法復(fù)制和使用《紐約時(shí)報(bào)》獨(dú)特有價(jià)值的作品”相關(guān)的“數(shù)十億美元的法定和實(shí)際損害”負(fù)責(zé)，還要求其銷毀使用《紐約時(shí)報(bào)》版權(quán)材料的所有AI模型和訓(xùn)練數(shù)據(jù)。

隨后OpenAI回應(yīng)稱，《紐約時(shí)報(bào)》的訴訟毫無根據(jù)，但仍然希望與其建立建設(shè)性的合作伙伴關(guān)系。

此外，據(jù)外媒報(bào)道，今年3月，OpenAI首席技術(shù)官M(fèi)ira Murati在接受采訪時(shí)還曾對(duì)Sora的訓(xùn)練數(shù)據(jù)來源含糊其辭。

當(dāng)被追問具體來源是否包含YouTube的視頻時(shí)，Murati回復(fù)“我實(shí)際上并不確定”，并拒絕回答有關(guān)Instagram或Facebook視頻是否被納入訓(xùn)練集的問題。她辯稱，如果這些視頻是公開可用且可以使用的，那么可能會(huì)被使用，但她本人對(duì)此并不確定。

責(zé)任編輯：孫扶

圖片編輯：陳飛燕

校對(duì)：張亮亮

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#YouTube #OpenAI