▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

GPT-4o模仿人聲說“不”,無意的語音生成仍是模型弱點

澎湃新聞記者 張靜
2024-08-13 10:06
來源:澎湃新聞
? 未來2% >
字號

·在OpenAI提供的案例中,AI模型發出“No”的聲音,后用一種與“紅隊”(OpenAI雇傭進行對抗性測試的人)相似的聲音繼續說話。數據科學家評價稱“OpenAI剛剛泄露了《黑鏡》下一季的劇情”。

和機器人對話,機器人突然開始用你的聲音和你說話,這并非科幻劇情,而是OpenAI披露的GPT-4o的詭異行為。

當地時間8月8日,OpenAI公開了ChatGPT背后的新型人工智能模型GPT-4o的安全報告,詳細說明模型限制和安全測試程序。評估的風險包括說話人身份識別、未經授權的語音生成、潛在的版權內容生成、無根據的推理和不允許的內容。在大模型的高級語音模式中,用戶可與人工智能助手進行語音對話,報告顯示,在測試過程中的極少數情況下,高級語音模式在未經允許的情況下會模仿用戶的聲音。

OpenAI提到,一個嘈雜的輸入會以某種方式促使模型突然模仿用戶的聲音。在OpenAI提供的無意的語音生成例子中,AI模型發出“No”的聲音,后用一種與“紅隊”(OpenAI雇傭進行對抗性測試的人)相似的聲音繼續說話。新聞網站BuzzFeed的數據科學家馬克斯·伍爾夫(Max Woolf)在社交媒體上對此評價,“OpenAI剛剛泄露了《黑鏡》下一季的劇情。”

GPT-4o可以在232毫秒內響應音頻輸入,平均時間為320毫秒,這與人類在對話中的響應時間相似。它可以合成訓練數據中發現的幾乎任何聲音,包括聲音效果和音樂。

OpenAI披露的實例反映了AI聊天機器人的安全架構越來越復雜。在未經授權的語音生成示例中,來自用戶的音頻噪聲混淆了模型,并作為一種無意的提示注入攻擊,將系統提示中的授權語音樣本替換為來自用戶的音頻輸入。目前尚不清楚嘈雜的音頻究竟是如何導致這種情況的,但音頻噪音可能被轉化為隨機的token,從而引發模型中的意外行為。

目前OpenAI設計了安全措施來防止模型模仿用戶聲音的情況,OpenAI提供授權的語音樣本供模型模仿,也用另一種系統檢測模型是否產生了未經授權的音頻。“我們只允許模型使用某些預先選擇的聲音,并使用輸出分類器來檢測模型是否偏離了這些聲音。”OpenAI表示,他們發現,未經授權的語音生成的剩余風險很小,在內部評估中目前系統100%捕捉到與系統聲音有意義的偏差。

“雖然無意的語音生成仍然是模型的一個弱點,但我們使用二級分類器來確保發生這種情況時對話將被中斷,從而使無意的語音生成風險降到最低。”但OpenAI也表示,當對話語言不是英語時,可能會導致模型過度拒絕。

對于說話人身份的識別,OpenAI對GPT-4o進行了后期訓練,讓它拒絕根據輸入音頻中的聲音來識別某人,但可以識別與名言相關的人。同時訓練GPT-4o拒絕輸出版權內容,建立了過濾器來檢測和阻止音樂輸出。

據Ars Technica報道,獨立人工智能研究員西蒙·威爾森(Simon Willison)表示,雖然GPT-4o語音合成能力的潛力目前受OpenAI的限制,但隨著時間的推移,類似的技術可能會從其他來源出現。“ElevenLabs已經可以為我們克隆聲音了,大約明年我們就可以在自己的機器上運行這樣的模型了。”

    責任編輯:盧雁
    圖片編輯:張同澤
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 密云县| 南部县| 湄潭县| 贵德县| 武冈市| 阿勒泰市| 滨海县| 色达县| 合作市| 滕州市| 尉犁县| 黑水县| 永仁县| 永德县| 云龙县| 连平县| 临高县| 横山县| 嘉黎县| 宜宾县| 东平县| 武汉市| 新泰市| 乐业县| 卢氏县| 将乐县| 南通市| 神池县| 前郭尔| 达州市| 余干县| 扎赉特旗| 屏东县| 乐至县| 达拉特旗| 莫力| 防城港市| 射阳县| 钟山县| 民和| 特克斯县|