▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

OpenAI用GPT4解讀GPT2,打敗魔法的只有魔法

2023-05-12 10:54
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
字號(hào)

來(lái)源丨元宇宙簡(jiǎn)史

作者丨元宇宙簡(jiǎn)史編輯 Eco

【元宇宙導(dǎo)讀】OpenAI最新研究利用GPT-4自動(dòng)進(jìn)行大語(yǔ)言模型中神經(jīng)元行為的解釋和評(píng)分,并將其應(yīng)用于另一種語(yǔ)言模型GPT-2,公開(kāi)了這些GPT-2神經(jīng)元解釋和分?jǐn)?shù)的數(shù)據(jù)集。這項(xiàng)技術(shù)讓人們能夠利用GPT-4來(lái)定義和自動(dòng)測(cè)量AI模型的可解釋性,從而更好地理解智能是如何工作的。

大語(yǔ)言模型(LLM)是基于大量文本數(shù)據(jù)訓(xùn)練,包含數(shù)千億或更多參數(shù)的語(yǔ)言模型。

在大數(shù)據(jù)時(shí)代,這類(lèi)AI機(jī)器學(xué)習(xí)模型可以在提升產(chǎn)品銷(xiāo)售、輔助人類(lèi)決策過(guò)程中起到很大的作用。

但是計(jì)算機(jī)通常不會(huì)解釋它們的預(yù)測(cè)結(jié)果,而語(yǔ)言模型想要變得更強(qiáng)大、部署更廣泛,就需要研究可解釋性,因?yàn)槿祟?lèi)對(duì)模型內(nèi)部工作原理的理解仍然非常有限,例如可能很難從中檢測(cè)到有偏見(jiàn)、欺騙性?xún)?nèi)容輸出。

可解釋性就是將模型能用通俗易懂的語(yǔ)言進(jìn)行表達(dá),把模型的預(yù)測(cè)過(guò)程轉(zhuǎn)化成具備邏輯關(guān)系的規(guī)則的能力,從而通過(guò)查看模型內(nèi)部來(lái)發(fā)現(xiàn)更多信息。

例如,如果有一個(gè)針對(duì)“漫威超級(jí)英雄”的神經(jīng)元,當(dāng)用戶向模型提問(wèn)“哪個(gè)超級(jí)英雄的能力最強(qiáng)”時(shí),這個(gè)神經(jīng)元就會(huì)提高模型在回答中說(shuō)出漫威英雄的概率。

 

站在OpenAI 的角度看,大模型未來(lái)將和人腦一樣擁有“神經(jīng)元”,這些神經(jīng)元會(huì)觀察文本中的特定規(guī)律,進(jìn)而影響到模型本身生產(chǎn)的文本。

所以可解釋性就是將模型能用通俗易懂的語(yǔ)言進(jìn)行表達(dá),把模型的預(yù)測(cè)過(guò)程轉(zhuǎn)化成具備邏輯關(guān)系的規(guī)則的能力,從而通過(guò)查看模型內(nèi)部來(lái)發(fā)現(xiàn)更多信息。

為了實(shí)現(xiàn)這個(gè)目標(biāo),OpenAI最近發(fā)布了一個(gè)關(guān)于GPT-4語(yǔ)言模型解析神經(jīng)元的對(duì)齊性研究成果,利用自研基于GPT-4技術(shù)的開(kāi)源工具,來(lái)嘗試計(jì)算其他架構(gòu)、更簡(jiǎn)單語(yǔ)言模型上神經(jīng)元的行為并對(duì)其進(jìn)行評(píng)分。

 

而且,還可以將其應(yīng)用于另一種語(yǔ)言模型中的神經(jīng)元——本次選擇4年前發(fā)布、包含307200個(gè)神經(jīng)元的大模型GPT-2為實(shí)驗(yàn)樣本,公開(kāi)了這些GPT-2神經(jīng)元解釋和分?jǐn)?shù)的數(shù)據(jù)集。

 

“我們邁出了使用 AI 進(jìn)行自動(dòng)化對(duì)齊研究的重要一步。”O(jiān)penAI 聯(lián)合創(chuàng)始人 Greg Brockman表示。

具體來(lái)說(shuō),OpenAI開(kāi)發(fā)了一套包含自動(dòng)化工具和測(cè)試方法的評(píng)估流程:

首先,研究人員讓GPT-2運(yùn)行文本序列,等待某個(gè)特定神經(jīng)元被頻繁“激活”;

 

然后,讓 GPT-4 針對(duì)一段文本生成解釋?zhuān)缤ㄟ^(guò)GPT-4接收到文本和激活情況判斷漫威是否與電影、角色和娛樂(lè)有關(guān);

隨后用 GPT-4 模擬 GPT-2 的神經(jīng)元接下來(lái)會(huì)做什么,預(yù)測(cè)行為;

 

最后評(píng)估打分,對(duì)比GPT-4模擬神經(jīng)元和GPT-2真實(shí)神經(jīng)元的結(jié)果的準(zhǔn)確度,在下圖這個(gè)例子中,GPT-4 的得分為0.34。

 

使用上述評(píng)分方法,OpenAI 開(kāi)始衡量他們的技術(shù)對(duì)網(wǎng)絡(luò)不同部分的效果,并嘗試針對(duì)目前解釋不清楚的部分改進(jìn)技術(shù)。例如,他們發(fā)現(xiàn)以下方式有助于提高分?jǐn)?shù):

- 迭代解釋。他們可以通過(guò)讓 GPT-4 想出可能的反例,在根據(jù)其激活情況修改解釋來(lái)提高分?jǐn)?shù);

- 使用更大的模型來(lái)進(jìn)行解釋。隨著解釋模型(explainer model)能力的提升,平均得分也會(huì)上升。然而,即使是 GPT-4 給出的解釋也比人類(lèi)差,這表明還有改進(jìn)的余地;

- 改變被解釋模型的架構(gòu)。用不同的激活函數(shù)訓(xùn)練模型提高了解釋分?jǐn)?shù)。

OpenAI 表示,他們正在將GPT-4編寫(xiě)的對(duì)GPT-2中的所有307,200個(gè)神經(jīng)元的解釋的數(shù)據(jù)集和可視化工具開(kāi)源,同時(shí)還提供了OpenAI API公開(kāi)可用的模型進(jìn)行解釋和評(píng)分的代碼,從而希望學(xué)術(shù)界能開(kāi)發(fā)出新的技術(shù)來(lái)提升GPT模型解釋分?jǐn)?shù)。

OpenAI還發(fā)現(xiàn),有超過(guò) 1000 個(gè)神經(jīng)元的解釋得分至少為0.8分,這意味著GPT-4模型可以解釋大部分人類(lèi)神經(jīng)元,同時(shí)目前GPT理解的概念似乎和人類(lèi)不太一樣。例如,他們發(fā)現(xiàn)了一些有趣但 GPT-4 并不理解的神經(jīng)元。

 

 

這些神經(jīng)元似乎對(duì)文本中的某些特征或模式有敏感度,但是GPT-4無(wú)法用簡(jiǎn)單的語(yǔ)言描述它們。OpenAI希望隨著技術(shù)和研究方法的改進(jìn),進(jìn)一步提高AI模型可解釋性能力,從而更好地理解這些神經(jīng)元的行為和意義。

對(duì)于本研究局限性, OpenAI表示,目前GPT-4生成的解釋還不完美,尤其要解釋比GPT-2更大的模型時(shí),表現(xiàn)效果很差。

神經(jīng)元復(fù)雜行為無(wú)法用簡(jiǎn)短的自然語(yǔ)言描述,OpenAI 解釋了神經(jīng)元的這種行為,卻沒(méi)有試圖解釋產(chǎn)生這種行為的機(jī)制,而且整個(gè)過(guò)程算力消耗極大等。

OpenAI 希望在未來(lái)的工作中可以解決上述這些問(wèn)題,最終OpenAI希望使用模型來(lái)形成、測(cè)試和迭代完全一般的假設(shè),從而比肩人類(lèi)大腦的想法和行為,以及將其大模型解釋為一種在部署前后檢測(cè)對(duì)齊和安全問(wèn)題的方法。

然而在這之前,OpenAI還有很長(zhǎng)的路要走。

“我們希望這將開(kāi)辟一條有前途的途徑。”Jeff Wu表示,這一技術(shù)可以讓其他人可以在此基礎(chǔ)上構(gòu)建并做出貢獻(xiàn)的自動(dòng)化方案,從而解決 AI 模型可解釋性問(wèn)題,很好地解釋這些模型行為,比如 AI 如何影響人類(lèi)大腦中的神經(jīng)元等。

嚴(yán)正聲明:本文為元宇宙簡(jiǎn)史原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載!內(nèi)容僅供參考交流,不構(gòu)成任何投資建議。任何讀者若據(jù)此進(jìn)行投資決策,風(fēng)險(xiǎn)自擔(dān)。

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            主站蜘蛛池模板: 前郭尔| 东辽县| 景谷| 耿马| 泌阳县| 望都县| 封丘县| 广灵县| 宁化县| 宜宾县| 新竹市| 辉南县| 如东县| 吉安县| 东乡县| 崇左市| 香格里拉县| 新宁县| 钟山县| 罗甸县| 留坝县| 类乌齐县| 朝阳区| 克什克腾旗| 龙州县| 大渡口区| 林周县| 海南省| 繁昌县| 方正县| 涟水县| 伊宁市| 玉溪市| 丹江口市| 青州市| 五大连池市| 拜泉县| 新和县| 罗山县| 永泰县| 高碑店市|