- +1
AI繪畫“打敗 98% 人類畫家”,卻為何畫不出一只好看的手?
從2022年開始,突然冒出了許多自動生成圖片的AI繪畫神器:Disco Diffusion、 DALL·E 2代等。
2022年8月31日,出自AI之手的《空間歌劇院》在美國科羅拉多州博覽會一項美術競賽中斬獲一等獎后,AI的作畫能力迅速成為焦點。
人們突然發現,仿佛是一夜之間,AI作畫的能力已經發展到了難以想象的地步,甚至直言:AI 就能生成可以「打敗 98% 人類畫家」的作品。
不過,最近有人發現,幾乎就要“亂拳打死老師傅”的AI,卻畫不好一只手,這是為什么呢?《紐約客》特約撰稿人凱爾·柴卡對此展開深入的探討。

01
人與AI都是畫手困難戶
畫手是高中藝術課上的經典練習:一個學生坐在桌子前,一手拿著炭筆,穩穩地放在一張紙上,另一只手在她面前攤開,手掌朝上,手指放松,向內彎曲。然后她用握筆的手在紙上畫出另一只攤開的手。這是每一個初學者的任務。
雖然看似簡單,但畫出令人信服的手卻是寫實藝術中最可怕的挑戰之一。我記得那十分令人沮喪——確保每根手指的角度和比例都是正確的,確定拇指與手掌的連接方式,表現一根手指恰好重疊在另一根手指上。通常情況下,我畫的小指會出奇地長,或者拇指以一個不可能的角度伸出來,就像一根斷了的骨頭。
“這就是學生開始學習如何畫畫的方式:學習仔細觀察,”我在美國康涅狄格州的高中美術老師克里斯蒂·蘇西最近給我打電話時告訴我,“每個人都以為他們知道手的樣子,但直到你真正看到它時,你才會明白。”
人工智能也面臨著類似的問題。Midjourney、Stable Diffusion和Dall-E等AI繪圖新工具能夠渲染逼真的風景,復制名人的臉,以任何藝術家的風格重新混合圖像,并無縫地替換圖像背景。

AI畫作《空間歌劇院》
去年9月,一張AI生成的圖像在科羅拉多州博覽會上獲得了數字藝術一等獎。但當被要求畫手時,這些工具就會產出一張張噩夢般的圖:一只有十幾個手指的手,一只有兩個拇指的手,還有一只像某種植物突變體一樣長出超多手的手。手指要么關節太多,要么根本沒有。它們看起來就像來自外星世界的醫學教科書上的圖表。
機器在這項特定任務上的無能已經成為了一個關于人工智能缺點的流行笑話,就像有人在推特上說的那樣,“永遠不要問一個女人的年齡或一個AI模型為什么要把手藏起來。”
正如其他報道,手的問題在一定程度上與生成器從訓練過的大量圖像數據集中推斷信息的能力有關。當用戶在生成器中輸入文本提示時,它會提取無數相關圖像并復制它已學習到的模式。

AI畫作
但是,就像考古學家試圖從羅塞塔石碑上翻譯埃及象形文字一樣,機器只能從給定的材料中推斷,而且它的知識存在空白,特別是在全面理解復雜的有機形狀時。有缺陷或不完整的數據集從而導致產生有缺陷的輸出。
02
大腦和AI的區別
語言學家諾姆·喬姆斯基和他的合著者最近在《紐約時報》的一篇專欄文章中指出,機器和人類的學習方式不同。他們寫道:“人類的大腦不像ChatGPT和它的同類那樣,是一個笨重的模式匹配統計引擎,吞噬著數千億字節的數據。”相反,它“使用少量信息;它不尋求推斷數據點之間的強力關聯,而是創造一種解釋。”
生成器可以計算出手有手指,但很難訓練它知道人只有五個手指,或者手指之間有或多或少的固定長度。畢竟,從不同的角度看,手的樣子是不一樣的。當我在筆記本電腦鍵盤上打字時,低頭看著自己的手指,我的手指被縮短了,被手掌遮住了一半;人們無法從靜態圖像中確定它們確切的X射線結構。

倫敦大學學院計算機科學教授彼得·本特利表示,AI工具“已經知道手有手指、指甲和手掌等元素。但他們不理解手究竟是什么。”
同樣的問題有時也會出現在AI試圖繪畫更小的特征時,比如耳朵,看起來像沒有復雜軟骨結構的肉質漩渦;或者牙齒,不正確地放在嘴里;或者瞳孔,變成了小山羊的斑點。AI可以掌握視覺模式,但無法掌握潛在的生物邏輯。
03
如何讓AI畫出更好的手
部分問題在于,大多數人的照片都沒有聚焦他們的手。AI面對的是人臉照片,而不是手指的特寫鏡頭。“如果數據集是百分之百的人手,我認為AI會做得更好,因為它會把更多的容量分配給人手。”Creative公司的聯合創始人亞歷克斯·查潘達爾說道。
一種解決方案可能是在專門的專題數據集上訓練AI程序。比如,查潘達爾目前正在制作完全由瀝青或磚塊圖像組成的訓練集,以便電影制作人或視頻游戲開發者可以快速添加表面紋理。
本特利教授認為,另一種可能是在AI數據集中添加三維效果圖。目前,AI工具還沒有可訓練的3D數據,但去年12月,OpenAI發表了一篇論文,介紹了一種創建三維模型的工具,這可以幫助圖像生成器獲得更多的空間意識,即對二維皮膚下骨骼結構的了解。不過,在新版的GPT-4中的并未著重展示此項功能。

在為AI生成器編寫提示時,用戶通常不是很精確。他們可能會輸入“手”這個詞,但沒有具體說明這只手應該做什么或它應該如何擺姿勢。
吉姆·南丁格爾曾是一名廣告文案,現在是一名人工智能顧問。他建議人們“想象一下訓練圖片可能是如何被貼上標簽的,轉而逆向設計你的提示。”還有,命名一些“可識別的手勢”,如握緊的拳頭,以及特征,如毛茸茸的指關節,用于幫助生成器自主分離更具體或詳細的源圖像。
然而,這樣的把戲并不總是奏效。南丁格爾的一位客戶是一位需要電子書封面的作家。AI生成了一個完美的人形,卻無法畫出作者想要的特定手勢,南丁格爾為此不得不請來一位自由職業的人類藝術家,手動將它們畫進這張圖像中。
04
人類的想象力是AI無法替代的
至少到目前為止,在生成式人工智能的生命周期中,用戶傾向于尋找盡可能接近現實的圖像。我們對AI的評價是基于它如何精確地復制我們已經看到的東西。看著粗糙的AI手,我們陷入深深的恐懼,并體驗到一種發自內心的厭惡感。雖然兩只手都是真實的,有紋理,有皺紋,有斑點,比大多數人類藝術家所能達到的細節要多,但是完全不是手應該有的樣子。
在某種程度上,這臺機器的故障令人欣慰。手是人性的象征,正如帕蒂·史密斯所說,“這是想象力和執行力之間的直接對應”。只要我們是唯一理解它們的人,也許我們的計算機不會完全取代我們。

AI手的奇怪扭曲讓人產生一種期待的懷舊之情,因為在未來,當技術不可避免地得到改進時,我們會把這些缺陷視為“早期人工智能”時代的庸俗遺跡,就像粗糙的數碼相機照片讓人想起2000年。
隨著時間的推移,我們對哪些圖像是由人工智能生成的,哪些是由人類手繪完成的越來越模糊。就像查潘達爾所說,雖然AI畫的奇怪的手指和不完整的爪子越來越多,但“只是一個暫時性的問題。”
美術老師蘇西在AI圖像和她學生的畫中指出了一個相似的新手問題。她說:“一個八年級或九年級的學生畫畫時,他們也總是把注意力集中在輪廓上。”
當一名年輕的藝術家在畫褶皺皮膚的扭動線條時,分心了,他就無法思考手的整體形狀。就像任何努力學習的藝術學生一樣,AI工具也需要更多的培訓,才能精進繪畫水平。“對于一個學生來說,當手的結構和輪廓結合在一起的那一刻,才能畫出一只真正的手,”蘇西說,“那通常是在他們大學二年級的時候。”
而AI能何時學會畫出一只“真正的手”,還需一定的時間,不過也許不用太久,讓我們一起盡請期待吧!
編譯/陳怡蕓 排版/阿桃 監制/April
原標題:《AI繪畫“打敗 98% 人類畫家”,卻為何畫不出一只好看的手?》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司