現在の AI は、膨大なオリジナルのトレーニング素材から絶妙な画像を生成できます。しかし原理的には、AIはまだ絵の中の要素をコラージュしたレベルにとどまっており、絵の中の要素を「理解」するのは難しい。そのため、AI によって生成された絵画には、細部が乱雑であったり、精査に耐えられない光と影の関係があったり、手足が歪んでいたりするなどの問題が発生することがよくあります。より高いディテール品質を必要とする業界では、間違いなく AI がアーティストのニーズを満たすことができません。
今、誰もがクリエイティブな人工知能と「AI アート」について話しており、アーティストの仕事を引き継ぐクリエイティブな AI の新時代の到来について話しています。アーティストやアート界からの大きな反発を目の当たりにしました。しかし、実際はその逆です。「AI アート」の時代は実際には終わったのかもしれません。
どうしたの?まず、私が「AI アート」とは何を意味するのかを明確にさせてください。
AIは芸術を創造するのではなく、画像を創造します。これらの生成された画像を芸術にしているのは、AI の背後にある人間のアーティストです。データをマシンに入力し、ノブを操作し、出力を管理するアーティストです。したがって、私は「AI アート」という用語を使用して、さまざまな程度の自律性を備えた創造的なプロセスの一部として AI を使用する人間のアートについて話します。こうしたツールが多用される時代が到来しています。しかし、これらのツールが芸術的天才を呼び起こした時代は終わったのかもしれません。
人工知能は「良い」を超えて「素晴らしい」になれるのか?敵対的生成ネットワーク (GAN) が出現したとき、一部のアーティストがこの新しい AI 技術に注目しました。これらのモデルを多くの画像でトレーニングすると、新しい画像を生成できます。 2017 年に西洋美術の古典的な肖像画で GAN をトレーニングしたところ、フランシス ベーコンの 1963 年のヘンレイタ モラエスの肖像画を思い出させる、不穏に変形した肖像画がいくつか生成されました。ただし、この 2 つには根本的な違いが 1 つあります。ベーコンの意図は肖像画を歪めることでしたが、AI はその世代において単に従わないだけです。
写真: フランシス・ベーコン「ヘンリエッタ・モラエスの肖像のための3つの習作」
GAN の出現により、マシンは「失敗の美学」の時代に入りました。一部の批評家はそれを「グリッチアート」と関連付けます。実際、GAN によってもたらされる驚きにより、アーティストは GAN に興味を持つようになりました。専門家の多くはこれを「不気味の谷効果」と呼んでいます。
2017 年から 2020 年にかけて AI アートを面白くするのは、この不気味の谷と偶然の出来事です。 2019 年、私は美術史家のマリアン・マゾーネ氏とともに、創作プロセスにおける人工知能の使用の先駆けとなった数人のアーティストにインタビューした調査を行いました。私たちは、「アーティストは人工知能を創造的プロセスの主な推進力として理解している」ことを発見しました。特にアーティストは、創造的なインスピレーションと創造的な量という 2 つの点で AI が役立つことに気づいています。クリエイティブ インスピレーションでは、アーティストが AI を見つけて、新しいアイデア、新しい方向性、アート制作の新しい方法を与えてくれます。
初期の AI モデルと今日の大規模なキューベースのモデルの根本的な違いは、初期のモデルが小さな画像セットでトレーニングされていることです。これにより、アーティストは独自のビジュアルリファレンスに基づいて独自の AI モデルをトレーニングできるようになります。今日の大規模なモデルは、アーティストの同意なしにインターネットから取得した何十億もの画像で事前トレーニングされています。これにより、多くの著作権問題が生じます。この無秩序に広がるシステムはアーティストのアイデンティティを消去します。私の仕事とあなたの仕事の違いは、システムをガイドするためにプロンプトでどのキーワードを使用するかによって決まります。著作権局がそのようなシステムで生成されたアートワークに対する著作権の付与を拒否するのも不思議ではありません。アーティストのアイデンティティを捉えることが、19 世紀後半に写真が法廷著作権を取得できた主な理由でした。
ここ数年、人工知能は高品質でリアルな画像を生成する能力がますます向上してきました。トレーニング データを模倣する機能も向上しています。主にテキスト プロンプトを使用してスポーンを制御する、新しい対話方法が導入されました。現在、テキストは人工知能が画像を生成する主な手段となっています。 AI 生成技術のこうした進歩により、AI は、私たちが慎重に作成したテキスト プロンプトで発した指示に従って、写真でもイラストでも、私たちが望むあらゆる画像を適切に生成できるようになりました。驚きは、私たちが得られるアイデアのバリエーションに限られています。複数回の反復により、必要な忠実度の高い、高解像度の見事な画像を取得できます。
テキスト入力は AI を「不気味の谷」から抜け出すのに役立ちますが、驚きを殺します。これは、モデルがテキストと画像の両方でトレーニングされ、視覚的な概念と言語の意味論を関連付けることを学習するためです。これにより、モデルは文字を作成したり、言葉で説明できるスタイルを模倣したりすることがより上手になります。
写真:ニューヨーク近代美術館所蔵のレフィク・アナドルの「監督なし」コレクション
しかしその一方で、トレーニングの一部として言語を含めると、モデルがインスピレーションを得た視覚的な変形を作成することが非常に制限されてしまいます。 AI によって作成される視覚的な出力は現在、私たちの言語によって制限されており、人間のセマンティクスに影響されずにピクセルを視覚的に操作する自由が失われています。
もちろん、人工知能は依然として生成プロセスにおいて驚くほど失敗します。私たちは今でも指が4本、足が3本ある人物を目にします。ただし、そのような愚かな失敗は必ずしも面白いとは限りません。この新世代の AI に欠けているのは創造的なインスピレーションだけではありません。アーティストは視覚的に考える人であるため、テキストを使用して画像を生成するという考えは、アーティストのインスピレーションを制限する可能性があります。彼らが望むものを説明するために言葉を使うと、不自然な言語的抽象化の層がさらに加わります。
AI は、アーティストが興奮する共同制作のパートナーではなく、大量の画像を生成するためのツールになりつつあります。 AI はルールに従うのが非常に上手になってきていますが、芸術的な輝きが欠けています。アーティストは芸術的な輝きを見つけるために、より深く掘り下げ、文字通りのプロンプトを超えて、人工知能を異なる方法で使用する必要があります。
ゲーム業界は AIGC を人工物だとみなしていますが、アーティストの半数以上が「役に立たなかった」とコメントしています。
出典: ゲームルック
GameLookレポート/海外のBlizzard、Ubisoft、UnityからNetEaseやTencentなどの国内業界リーダーまで、大規模AIGCの時代に、世界のゲーム業界が主導権を握り、AI大規模モデル技術の実装の包括的な検討を開始しました。
その中でも、ヴィンセント図技術は最も普及に近い技術です。 Stable Diffusion などのオープンソース グラフィック ツールは現在、ゲーム アート ワーカーの右腕となっており、Blizzard などの企業も、開発者がより便利にアートを作成できるよう自社開発の生成モデルを立ち上げています。業界はその手を広げ、AIGC テクノロジーを一般に受け入れてきましたが、一部の姉妹業界では、AIGC の推進がまだ不安定です。
アーティスト調査レポート: AI はまだ高級路線を実現できない
美術産業はその最も代表的な例です。最近、海外のジェネレーティブAIアート企業であるPlayform AIが500人のアーティストとデジタルデザイナーにアンケート調査を行った結果、半数以上のアーティストがDALL-EやMidjourneyなどのWen作品を試しても自分には役に立たないと感じていることが判明した。 Shengtu AI.を作成します。
ゲームアートの世界は本格化している一方で、純粋なアートの世界は比較的無関心です。 GameLook の観点から見ると、その違いは非常に興味深いものです。ゲームペインターもデジタルアーティストも表向きは絵を描くことに携わっていますが、その裏では最終納品物に対する両業界のニーズは大きく異なります。商業ゲーム アーティストにとって、プロジェクトのニーズを満たすアート リソースを出力することは最優先事項です。アーティストにとって、求められる最終製品はより「ハイエンド」であり、丁寧に作られた絵画の品質だけでなく、個人的なタッチを備えた芸術的表現やスタイルもより重要です。
この理解の欠如により、当然のことながら、絵の構成などのスキルを調整することが非常に困難になります。多くの場合、AI が行うのは入力テキストとパラメーターを組み合わせるだけです。基本的にAI絵画は思想的な表現が難しいため、今回インタビューしたアーティストも、AIによって生成された作品がアーティスト自身のスタイルを反映できると考えている人はわずか30%だったという。
また、アーティストたちはAIに対してさまざまな批判を行っている。たとえば、AI 描画の著作権に問題がないと考えているアーティストはわずか 30% ですが、アーティストの半数以上は依然として著作権上の懸念があると考えています。また、アーティストは、現在の AI モデルでは最終出力を正確に制御することがまだ難しく、AI によって生成される解像度とディテールの制御ではニーズを満たせないことにも不満を抱いています。
ビジネスを超えた別の次元
AIGC は生産性の大幅な向上をもたらしましたが、その後には終わりのない不安が伴います。かつて「画家は交代する!」などの発言が流行ったこともあり、美術業界関係者はAIGCに対する警戒感を強めている。
失業に不安を感じながらも、じっと座っているのではなく、この機会に固有の認識を打ち破り、人間の競争価値を再評価してはいかがでしょうか。現在の AIGC にはまだ欠点や欠点が多すぎることがわかります。たとえば、人間のように考えることができません。芸術創作にとってこれは致命傷となるため、優れた創造性や人間味あふれるアイデアはAI時代にはますます貴重になるだろう。
Playform AI の創設者であるアーメド・エルガマル氏は最近、「なぜ AI アートの時代は過ぎたのか」という記事を執筆し、彼の興味深い考えを私たちに共有してくれました。
アーメド・エルガマルは、ユニークな履歴書を持つ学際的な才能の持ち主です。ラトガース大学の人工知能アートラボの所長として、彼は確かな美術教育を受け、人工知能テクノロジーについての深い理解を持っています。アーメド・エルガマル氏の見解では、AI時代が到来して人間に取って代わられると言うよりも、現在のAIモデルがあまりにも馴染みすぎていて「人間の思考を模倣」しており、AIが持つ創造性を抑圧していると言う方が適切だという。アーメド・エルガマル氏は、「AIアート」の時代は事実上終わったと考えている。
GameLook は、Ahmed Elgammal によるこの素晴らしい記事をまとめました:
今、誰もがクリエイティブな人工知能と「AI アート」について話しており、アーティストの仕事を引き継ぐクリエイティブな AI の新時代の到来について話しています。アーティストやアート界からの大きな反発を目の当たりにしました。しかし、実際はその逆です。「AI アート」の時代は実際には終わったのかもしれません。
どうしたの?まず、私が「AI アート」とは何を意味するのかを明確にさせてください。
AIは芸術を創造するのではなく、画像を創造します。これらの生成された画像を芸術にしているのは、AI の背後にある人間のアーティストです。データをマシンに入力し、ノブを操作し、出力を管理するアーティストです。したがって、私は「AI アート」という用語を使用して、さまざまな程度の自律性を備えた創造的なプロセスの一部として AI を使用する人間のアートについて話します。こうしたツールが多用される時代が到来しています。しかし、これらのツールが芸術的天才を呼び起こした時代は終わったのかもしれません。
何が芸術に火をつけるのか?ピカソが 1907 年に「アヴィニョンの乙女」を制作したとき、この絵は物議を醸し、彼に近い友人たちから反対されました。ピカソのキュビストの同僚ジョルジュ・ブラックでさえこの絵が好きではありませんでした。この絵がキュビズムの先駆者として一般に受け入れられ、認識されたのは、1939 年にニューヨーク近代美術館で展示されてからでした。ジョナサン・ジョーンズはガーディアン紙100周年について「芸術作品はやがて落ち着いて立派なものになる。しかし、100年経った今でも、このピカソはとても新鮮で、とても不安なので、これを『傑作』と呼ぶのは控えめな表現だ」と書いた。
芸術的発展における不穏な課題の役割は、コリン・マーティンデールが 1990 年の著書『時計じかけのミューズ』で開拓した美的心理学の理論によってよく説明されています。彼は、芸術の進化の背後にある主な力は、芸術家が革新を通じて習慣と闘うことであると信じています。しかし、アーティストが革新しすぎると、そのアートが衝撃的すぎて、観客に好まれなくなります。優れたアーティストは、革新的であることと衝撃的すぎないことの間の最適なポイントを見つけます。偉大なアーティストとは、さらに先を行く人です。
人工知能は「良い」を超えて「素晴らしい」になれるのか?敵対的生成ネットワーク (GAN) が出現したとき、一部のアーティストがこの新しい AI 技術に注目しました。これらのモデルを多くの画像でトレーニングすると、新しい画像を生成できます。 2017 年に西洋美術の古典的な肖像画で GAN をトレーニングしたところ、フランシス ベーコンの 1963 年のヘンレイタ モラエスの肖像画を思い出させる、不穏に変形した肖像画がいくつか生成されました。ただし、この 2 つには根本的な違いが 1 つあります。ベーコンの意図は肖像画を歪めることでしたが、AI はその世代において単に従わないだけです。
GAN の出現により、マシンは「失敗の美学」の時代に入りました。一部の批評家はそれを「グリッチアート」と関連付けます。実際、GAN によってもたらされる驚きにより、アーティストは GAN に興味を持つようになりました。専門家の多くはこれを「不気味の谷効果」と呼んでいます。
2017 年から 2020 年にかけて AI アートを面白くするのは、この不気味の谷と偶然の出来事です。 2019 年、私は美術史家のマリアン・マゾーネ氏とともに、創作プロセスにおける人工知能の使用の先駆けとなった数人のアーティストにインタビューした調査を行いました。私たちは、「アーティストは人工知能を創造的プロセスの主な推進力として理解している」ことを発見しました。特にアーティストは、創造的なインスピレーションと創造的な量という 2 つの点で AI が役立つことに気づいています。クリエイティブ インスピレーションでは、アーティストが AI を見つけて、新しいアイデア、新しい方向性、アート制作の新しい方法を与えてくれます。
現在の非難の雰囲気とは異なり、2017年から2020年にかけて人工知能アートはアート界に歓迎されてきました。
2018年10月、クリスティーズは、前述のデフォルメされた肖像画と同様の、GANで生成された人工知能の肖像画をオークションに出品した。 2019年3月、サザビーズはアーティスト、マリオ・クリンゲマンの作品をオークションに出品した。マンハッタンのHG Contemporaryでは、2019年2月に私自身の作品を展示する展覧会が開催されました。 2019 年の夏、ロンドンのバービカン センターではさまざまな人工知能アーティストの作品が展示されました。 AI アートは、2018 年のスコープ マイアミや 2019 年のスコープ ニューヨークなどのアート フェアで歓迎されました。北京の中国国立博物館は 2019 年 11 月に 1 か月間にわたって AI アート展を開催し、100 万人の観客を集めました。
この時期、AIアートがメディアで盛んに報道された。アート市場はAIアーティストを歓迎しており、AIアートの禁止を求める人はいない。しかし、その後何が起こったのでしょうか?
初期の AI モデルと今日の大規模なキューベースのモデルの根本的な違いは、初期のモデルが小さな画像セットでトレーニングされていることです。これにより、アーティストは独自のビジュアルリファレンスに基づいて独自の AI モデルをトレーニングできるようになります。今日の大規模なモデルは、アーティストの同意なしにインターネットから取得した何十億もの画像で事前トレーニングされています。これにより、多くの著作権問題が生じます。この無秩序に広がるシステムはアーティストのアイデンティティを消去します。私の仕事とあなたの仕事の違いは、システムをガイドするためにプロンプトでどのキーワードを使用するかによって決まります。著作権局がそのようなシステムで生成されたアートワークに対する著作権の付与を拒否するのも不思議ではありません。アーティストのアイデンティティを捉えることが、19 世紀後半に写真が法廷著作権を取得できた主な理由でした。
ここ数年、人工知能は高品質でリアルな画像を生成する能力がますます向上してきました。トレーニング データを模倣する機能も向上しています。主にテキスト プロンプトを使用してスポーンを制御する、新しい対話方法が導入されました。現在、テキストは人工知能が画像を生成する主な手段となっています。 AI 生成技術のこうした進歩により、AI は、私たちが慎重に作成したテキスト プロンプトで発した指示に従って、写真でもイラストでも、私たちが望むあらゆる画像を適切に生成できるようになりました。驚きは、私たちが得られるアイデアのバリエーションに限られています。複数回の反復により、必要な忠実度の高い、高解像度の見事な画像を取得できます。
テキスト入力は AI を「不気味の谷」から抜け出すのに役立ちますが、驚きを殺します。これは、モデルがテキストと画像の両方でトレーニングされ、視覚的な概念と言語の意味論を関連付けることを学習するためです。これにより、モデルは文字を作成したり、言葉で説明できるスタイルを模倣したりすることがより上手になります。
しかしその一方で、トレーニングの一部として言語を含めると、モデルがインスピレーションを得た視覚的な変形を作成することが非常に制限されてしまいます。 AI によって作成される視覚的な出力は現在、私たちの言語によって制限されており、人間のセマンティクスに影響されずにピクセルを視覚的に操作する自由が失われています。
ある意味、人工知能はますます私たちに似てきており、もはや私たちの世界の見方を補完したり、挑戦したりすることはできません。
もちろん、人工知能は依然として生成プロセスにおいて驚くほど失敗します。私たちは今でも指が4本、足が3本ある人物を目にします。ただし、そのような愚かな失敗は必ずしも面白いとは限りません。この新世代の AI に欠けているのは創造的なインスピレーションだけではありません。アーティストは視覚的に考える人であるため、テキストを使用して画像を生成するという考えは、アーティストのインスピレーションを制限する可能性があります。彼らが望むものを説明するために言葉を使うと、不自然な言語的抽象化の層がさらに加わります。
AI は、アーティストが興奮する共同制作のパートナーではなく、大量の画像を生成するためのツールになりつつあります。 AI はルールに従うのが非常に上手になってきていますが、芸術的な輝きが欠けています。アーティストは芸術的な輝きを見つけるために、より深く掘り下げ、文字通りのプロンプトを超えて、人工知能を異なる方法で使用する必要があります。