遊戲業奉為神器的AIGC,過半藝術家卻評價“沒啥幫助”,為什麼?

來源:gamelook

GameLook報導/大AIGC時代下,從海外的暴雪、育碧、Unity到國內的網易、騰訊等行業領頭羊,全球遊戲工業界已經身先士卒,開啟了AI大模型技術落地的全面探索。

在這其中,又以文生圖技術最為接近普及。 Stable Diffusion等開源文生圖工具如今已經成為遊戲美術工作者的左膀右臂,如暴雪等公司也推出自研生成模型,幫助開發者更便捷地進行美術創作。工業界已經展開雙臂,普遍接納AIGC技術,但在一些姊妹行業,AIGC的推廣之路依然坎坷。

藝術家調研報告:AI還是做不了高端路線

純藝術行業就是最具代表性的一個例子。由於近日,一家海外生成式AI藝術公司Playform AI向500名藝術家與數字設計師發出了問卷調查,結果顯示,有超過一半的藝術家在嘗試過DALL-E、Midjourney等文生圖AI後認為無法幫助他們進行創作。

Playform AI公司定位於藝術生成平台,因此此次受訪的創作者大多數來自純藝、數字設計、攝影等較為傳統的行業背景。同樣在該調查中,僅有18%的的創作者表示會每日在創作中使用AI生成工具。另外,6成藝術家認為AIGC工俱生成的圖像質量達不到他們的質量標準。

一邊是遊戲美術界的熱火朝天,一邊是純藝界的相對冷淡。在GameLook看來,這其中的差異相當有趣。表面上看,遊戲畫師與數字藝術家們均以畫圖為業,但在背後,兩個行業對最終交付產物的需求大相徑庭。對商業遊戲畫師們來說,產出符合項目需求的美術資源是第一要務。而對於藝術家們來說,他們需要的最終產物更加“高端”,不僅需要精雕細作的作畫質量,還要兼顧有個人色彩的藝術表達與風格要更加重要。

目前的AI能夠藉由海量的原始訓練材料生成出精緻的畫面。但從原理上說,AI對畫面中的元素還尚處拼貼的程度,難以形成對畫中元素的“理解”。因此,由AI生成的畫作往往有細節走線凌亂,光影關係經不起推敲,乃至肢體扭曲的問題。對於對細節品質要求更高的行業來說,AI無疑還無法滿足藝術家的需求。

這種理解的缺乏自然也讓畫面構圖等技巧的調整變得十分困難。更多的時候,AI所做的只是集於輸入文本和參數進行排列組合。從根本上說,AI的作畫難以形成思想性的表達,因而此次接受受訪的藝術家們也表示,僅有三成認為AI生成的產物可以反映出藝術家自己的風格。

此外,藝術家們還對AI有著各種各樣的批評。例如,僅有3成藝術家認為AI畫圖的版權不存在問題,而過半藝術家認為依然有版權隱憂。藝術家們還不滿稱,眼下的AI模型依然很難對最終產出進行精準控制,AI生成的分辨率與細節控制也無法滿足他們的需求。

相對於高度流水線化的遊戲行業來說,主打精工細作純藝市場並沒有受到AIGC的太多衝擊。不過,藝術家們也一定程度地出現了身份危機。

商業以外的另一個維度

AIGC為我們帶來了生產力的極大進步,但隨之而來的則是無止境的焦慮。諸如“畫家要被取代了!”這樣的言論曾經大行其道,也是美術行業從業者對AIGC警惕心理更強的原因。

在失業焦慮的同時,與其坐以待斃,我們不妨藉著這個機會打破固有的認知,重估人類的競爭價值。我們可以看到,眼下的AIGC仍然有太多的缺憾與短板。例如,它無法像人類一樣思考。對藝術創作來說,這是致命傷,因此優秀的創意與人文思想在AI到來的時代只會變得更加珍貴。

Playform AI的創始人Ahmed Elgammal在近期撰寫了一篇文章《為什麼AI藝術的時代已經過去了》,向我們分享了他的有趣思考。

Ahmed Elgammal是一名履歷獨特的跨學科人才——作為羅格斯大學人工智能藝術實驗室的負責人,他既接受了紮實的藝術教育,也對人工智能技術有深入淺出的理解。而在Ahmed Elgammal看來,與其說AI時代即將到來,進而取代人類,不如說眼下的AI大模型太熟稔與“模仿人類思考”,這樣反而扼殺了屬於AI的創造力。 Ahmed Elgammal認為,“AI藝術”的時代實際上已經結束。

GameLook編譯了Ahmed Elgammal的這篇好文:

現在每個人都在談論創造性人工智能和“人工智能藝術”,談論一個新的創造性AI時代的到來,而它將取代藝術家的工作。我們看到來自藝術家和藝術界的巨大反彈。然而事實恰恰相反:“AI藝術”時代實際上可能已經結束。

究竟發生了什麼?首先,讓我澄清一下“AI藝術”的含義。

AI並不創造藝術,而是創造圖像。使這些生成的圖像成為藝術的是AI背後的人類藝術家——那些向機器輸入數據、操縱旋鈕並策劃輸出的藝術家。因此,我使用“AI藝術”這個術語來談論人類藝術,這些藝術將AI作為創作過程的一部分,具有不同程度的自主性。我們正在進入一個大量使用此類工具的時代。然而,這些工具激發出藝術天才火花的時代可能已經過去了。

是什麼讓藝術迸發出火花?當畢加索在1907年創作《亞維農的少女》時,這幅畫曾引起爭議,並遭到了他身邊朋友的反對。就連畢加索的立體主義同事喬治-布拉克(George Braque)也不喜歡這幅畫。直到1939年,當這幅畫在紐約現代藝術博物館展出時,它才被公眾接受並認可為立體主義的先驅。喬納森-瓊斯(Jonathan Jones)在《衛報》的百年慶典上寫道: “藝術作品最終會沉澱下來,變得受人尊敬。但是,100年過去了,畢加索的這幅作品仍然是如此新鮮,如此令人不安,稱其為'傑作'簡直是一種貶低。”

圖:畢加索《亞維農的少女》

科林-馬丁代爾(Colin Martindale)在1990年出版的《The Clockwork Muse》一書中開創的美學心理學理論可以很好地解釋令人不安的挑戰在藝術發展中的作用。他認為,藝術進化背後的主要力量是藝術家通過創新來對抗習慣。然而,如果藝術家創新太多,他們的藝術就會過於震撼,觀眾就會不喜歡。好的藝術家能夠在創新和不太令人震驚之間找到最佳平衡點。偉大的藝術家則是那些更進一步的藝術家。

人工智能能否超越“好”而達到“偉大”的程度?當生成對抗網絡(GAN)出現時,一些藝術家注意到了這項新的人工智能技術。你可以在大量圖像上訓練這些模型,它們可以為你生成新的圖像。 2017年,當我們對西方藝術中的經典肖像進行GAN訓練時,它生成了一些令人不安的變形肖像,這讓我想起了弗朗西斯-培根1963年創作的Henreitta Moraes肖像。然而,這兩者之間有一個根本的區別: 培根的意圖是讓肖像產生變形扭曲的效果,而人工智能只是生成時不聽話而已。

圖:弗朗西斯-培根《Three Studies for Portrait of Henrietta Moraes》

隨著GAN的出現,我們進入了機器“失敗美學”的時代。一些評論家將其與“故障藝術”聯繫在一起。事實上,GAN所帶來的驚喜讓藝術家們對其產生了濃厚的興趣。該領域的許多人稱之為“恐怖谷效應”。

正是這種恐怖谷和偶然性讓人工智能藝術在2017年至2020年間變得有趣。 2019年,我與藝術史學家瑪麗安-馬佐內(Marian Mazzone)一起做了一項研究,我們採訪了幾位在創作過程中率先使用人工智能的藝術家。我們發現,“藝術家將人工智能理解為自己創作過程的主要推動力”。特別是,藝術家們發現AI在兩個方面非常有用:創作靈感和創作數量。創作靈感是藝術家們發現AI給他們帶來新想法、新方向和新的藝術創作方式的地方。

圖:使用GAN生成的人物肖像,製作於2007年

與當下的一片聲討的氛圍不同,人工智能藝術在2017年至2020年間受到了藝術界的歡迎。

2018年10月,佳士得拍賣行拍賣了一幅由GAN生成的人工智能肖像畫,與上述變形肖像畫類似。 2019年3月,蘇富比拍賣了藝術家馬里奧-克林格曼(Mario Klingemann)的作品。曼哈頓的HG Contemporary於2019年2月舉辦了一次展覽,展出了我自己的作品。 2019年夏天,倫敦巴比肯中心展出了不同的人工智能藝術家的作品。人工智能藝術在2018年邁阿密Scope和2019年紐約Scope等藝術博覽會上受到歡迎。北京中國國家博物館於2019年11月舉辦了為期一個月的人工智能藝術展,吸引了100萬觀眾。

在此期間,媒體對人工智能藝術進行了積極報導。藝術市場歡迎人工智能藝術家,也沒有人呼籲禁止人工智能藝術。但後來究竟發生了什麼?

圖:Mario Klingemann肖像作品《Memories of Passersby》

早期的人工智能模型與今天基於提示的大模型之間的一個根本區別是,早期的模型是在較小的圖像集上進行訓練的。這使得藝術家可以根據自己的視覺參考資料訓練自己的人工智能模型。而如今的大模型則是在未經藝術家同意的情況下,在從互聯網上獲取的數十億張圖片上預先訓練出來的。這帶來了大量的版權問題。這種龐大的系統會抹去藝術家的身份。我的作品與您的作品之間的區別僅僅取決於我們在提示中使用了哪些關鍵詞來引導系統。無怪乎版權局拒絕為此類系統生成的藝術作品授予版權。捕捉藝術家身份是攝影作品在19世紀末能夠獲得法院版權的主要原因。

在過去幾年中,人工智能在生成高質量圖像和逼真圖像方面的表現越來越好。它在模仿訓練數據方面的能力也在不斷提高。一種新的交互方式已被引入,主要是使用文本提示來控制生成。如今,文字已經成為人工智能生成圖像的主要方式。人工智能生成技術的這些進步已經使人工智能能夠很好地按照我們在精心製作的文字提示中發出的指令生成我們想要的任何圖像,無論是照片還是插圖。驚喜僅限於我們可能得到的想法的變化。通過多次重複,我們可以得到我們想要的令人驚嘆的高保真、高分辨率圖像。

文字輸入幫助人工智能走出了“恐怖谷”,但它扼殺了驚喜。這是因為這些模型同時接受了文字和圖像的訓練,並學會了將視覺概念與語言語義聯繫起來。這使得模型更善於創造人物形象和模仿可以用文字描述的風格。

圖:Refik Anadol作品《Unsupervised》 收藏於紐約現代藝術博物館

但另一方面,將語言作為訓練的一部分會使模型在創建靈感視覺變形時受到很大限制。 AI現在打造的視覺輸出受限於我們的語言,失去了在視覺上自由操作像素而不受人類語義影響的自由。

從某種意義上說,人工智能正變得越來越像我們,它不再能夠在我們看待世界時提供補充和挑戰。

當然,人工智能在生成過程中仍然會出現令人驚訝的失敗。我們仍然能看到長著四隻手指和三條腿的人物。然而,這種愚蠢的失敗並不一定有趣。創造性靈感並不是新一代人工智能所失去的唯一東西。使用文本生成圖像的理念可能會限製藝術家的靈感,因為藝術家們是視覺型思維者。借助文字描述他們想要的東西會增加一層額外的、不自然的語言抽象。

AI正在成為生成大量圖像的工具,而不是讓藝術家們為之興奮的共同創作夥伴。 AI正變得非常善於循規蹈矩,但其中的藝術火花卻蕩然無存。藝術家必須深入挖掘,超越文字提示詞,以不同的方式使用人工智能,這樣才能找到藝術的火花。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)