2022年夏、描画AIが静かに躍動を開始

想像を絶する絵がわずか１〜２分で次々と

「アルミでできた花」、「葛飾北斎が描いたバベルの塔」、「マリー・クワントの服を着たヴィダル・サスーンのモデルをルディ・ガーンライヒが撮り下ろした1960年代風ファッション写真」、「海に浮かぶ街」、すぐには想像できない無茶振りの注文をパソコンに向かって英語で打ち込むとわずか１〜２分でそれっぽい絵が次々と表示される。

下で紹介しているのは、そうやって実際に筆者がAIに描かせた絵だ。

アルミでできた花。Stable Diffusionエンジンで動作する描画AIサービス、「Dream Studio」を使って描画。

この夏、「T2I（Text-to-Image）」などと呼ばれる絵を描くAIが世界に大きな衝撃を与えた。

昨2021年1月、イーロン・マスク氏も関わるOpenAIが開発した「DALL-E（ダリ）」という研究プロジェクトが人間の言葉の意図を正確に理解していることや、描かれる絵がリアルであることで注目を集めた。関係者しか利用ができないAIだったが、2022年6月、進化版「DALL-E 2」をテスト利用する招待状が100万人に送られると、IT界隈のインフルエンサーが、次々と自ら描いたAI画を発信して話題になり始めた。翌7月、David Holz氏という米国の技術者が開発していた描画AIの「midjourney（ミッドジャーニー）」が招待状なしで誰でも利用できる形で公開テストを開始。これが一気に話題を広めた。IT系のニュース媒体は連日のように描画AIのニュースを伝え、ソーシャルメディアにも毎秒世界中からAI画が投稿されている。

8月末時点での描画AIはまだ稚拙で、描画する絵や写真をあまり細かく指定しても、すべてを汲み取ってはくれなかったり、描画に失敗すると人の顔の部分が潰れて怖い絵になったりすることがある。

とはいえ失敗したら、少し説明文を書き換えて何度でも何枚でも絵を描かせられる。コツを掴むとかなり良い感じの絵が得られるようになる。

テスト公開とは言ってもAIでの描画はコンピューターへの負荷も大きいため、midjourneyではたくさん絵を描かせる人には有料オプション、法人利用をする人には法人オプションを用意。その代わり、有料オプションを選んだ人には絵を商用利用も含めて自由に活用していい権利を与えるなどしている。

マリー・クワントの服を着たヴィダル・サスーンのモデルをルディ・ガーンライヒが撮り下ろした1960年代風ファッション写真。

今後はマスメディアやブログなどでもイラストレーターに発注したり、ストック写真、ストックイラストを買う代わりにAIに思い通りの絵を描かせて使うことが増えてくるのかも知れない。実際、「AIの新境地」を特集したイギリスの週刊誌「エコノミスト」の2022年6月号はmidjourneyが描いた絵が表紙を飾り、イタリアの新聞「Corriere della sera」はVanni Santoni氏がmidjourneyを使って描いた絵で構成した漫画が掲載された。

---fadeinPager---

「10億人をクリエイティブに」オープンソースに解き離れた描画AI

だが、ここまでは2022年夏の描画AI旋風の序章に過ぎない。さらに8月の下旬になると、「美しさ」を重視した写実的な絵（や写真）が得意という前評判の描画AI技術の「Stable Diffusion」が注目の的になる。これは英米に拠点を置くStability AI 社がConpVis及びLAIONというオンライン研究コミュニティと作った描画AIだ。

Stability AI創業者のエマード・モスタークは「10億人をクリエイティブにする」という宣言通り、8月下旬に登録すれば誰でも利用できる「Dream Studio」という半有料のサービスの提供を開始したのに加え、描画AIの核「Stable Diffusion」のソースコードを公開、つまり、描画AIを全て無料開放してしまったのだ。

このため対応パソコンを持っている人なら、自分のパソコンにインストールしてしまえば一切、お金を払わずに無料で好きなだけAIに絵を描かせ続けることもできる。

もっとも、パソコンへのインストールは難易度が高い。インストールできない人は利用量に応じて課金が発生する「Dream Studio」を使って欲しい、という意図だ。

Dream Studioを使って絵を描いているところ。「京都の石庭に座っているお坊さん」を描かせたところ。

ソースコードの公開を受けてStable Diffusionベースに改造を加えた独自の描画AIサービスを作る人たちも登場している。早くから描画AIに関して積極的な情報発信を続けてきた著名エンジニアの清水亮氏は「memeplex.app」（ https://memeplex.app ）という日本語でも指示が出せる描画AIサービスの提供を開始した。同様に九州工業大学の学生、miyasatota氏はLINEから、描きたい絵の詳細を日本語で指定すると、数十秒でその絵がLINEで返信される「お絵描きばりぐっどくん」（https://varygoodkun.net/app/お絵描きばりぐっどくん/）を公開。

LINEを通して利用できる「お絵描きばりぐっどくん」は、細かな画質調整などはできないが日本語で指示を出せるのも魅力。https://varygoodkun.net/app/お絵描きばりぐっどくん/

Stable Diffusion系の描画AIは、利用のための敷居を下げただけでなく、描画AIとしての規律にも緩い部分があり、これが新たな議論を呼んでいる。

特に問題となっているのは現役クリエイターの仕事を奪う懸念や著作権上の配慮、そして政治的・宗教的あるいは性的な画像への応用だ。

---fadeinPager---

開かれたパンドラの箱と新たな課題

1826年にカメラの登場を知りポール・ドラローシュが「今日を限りに絵画は死んだ」と語ってから200年近く経った今でも絵画が死んでいないように、描画AIが普及したからといって絵画作品やアート写真の価値がなくなることはないだろう。

だが、無料でそれなりのクオリティーのイラストや写真風の画像がいくらでも作れるようになることで、受注ベースで作品を作っている知名度の低いクリエイターにとっては厳しい状況が生まれるかも知れない。

既に作風も知名度も確立したクリエイターは、そう簡単にAIに仕事を奪われることはないと思うが、AIに作風を真似されるという新たな不安が広がる可能性がある。

DALL-Eを開発するOpenAIは「人類全体に、害をもたらすよりは、有益性があるやりかたで、オープンソースと親和性の高い人工知能を、注意深く推進すること」を目的に掲げる組織だ。

それだけに「DALL-E」の開発でも、現役の風景写真家の作品を学習データから排除するなどクリエイターとの共存への配慮を見せていた。

これに対して、アーティストのRJ Palmer氏が、Stable Diffusionは現役で活動中のアーティストの絵を学習データに使っており、潜在的に現役のクリエイターの仕事を奪いかねず権利侵害にあたると指摘。問題視されている。

日本ではラディウス・ファイブ社が、自分で描いた絵を15枚学習させると、その画風で次々と新しい絵を描いてくれる「mimic」という描画AIサービスを発表。しかし、作者以外の人が悪用する可能性があるという意見が殺到し、サービスを一時停止する騒ぎがあった（同社では対策が取れ次第、正式版としてサービスを再開するとしている）。

今日のAIは、既にある絵を学習してそれを手本にするが、どんな絵を学習させるかは著作権などの権利侵害につながる懸念に加え、人種差別などの問題につながる懸念もある（例えば貧しい人の絵や写真として特定の人種の絵ばかりを学習してしまうと、描かれる絵にもそうした傾向が表れ、そうした偏見を助長しかねない）。

DALL-E 2公式ホームページより（https://openai.com/dall-e-2/）。既存の絵を他の画家のタッチで描きなおさせることができる。このように絵を見て「何が描かれているのか」と「どのように描かれているのか」を切り分けて認識する技術は2016年登場の「StyleTransfer」というAIプロジェクトから始まり、今では当たり前になっている。なお、DALL-Eを利用したい人は、ここでWAITING LISTに名前とメールアドレスを登録しておくと、遠からず招待状が届くかも知れない。

他の作家の描いた絵を学習し、絵を描かせることに著作権上の問題はないのかという指摘も多い。しかし、この声に対しては「そもそも人間も他の作家の作品を見て学んでいるのではないか」という指摘もある。

描画AIは、絵が苦手だった人でも言葉だけで簡単に本格的な絵が描ける、という福音をもたらす一方で、議論されるべき新たな課題も多く生み出している。だが、もうパンドラの箱は開かれてしまった。既に世界では毎秒AIを使って膨大な数の絵が描かれ続けている。

今になって突然、スマートフォンやソーシャルメディアが無かったことにはならないように、描画AIの技術も今さら無かったことにはできない。

今、我々がするべきことは、この道具が我々の社会の中でどのように使われ、どのように人間のクリエイターたちと共存していくのかを議論したり、こうしたツールが当たり前になる時代の子供たちにどのような美術の教育をすればいいかを議論することだろう。

なお、今回、紹介したのは言葉に従って絵を描くAIだけだが、下絵を元に目指している絵を完成させてくれる描画AIの開発も進んでいる。いや、描画AIだけではない。

コロナ禍、人々の動きが停滞する中、急速にAIの技術が発展した。2020年にはかなり高い精度で米国で英語の読解と作文ができるAIが完成。大学の論文なども人間の大学生に負けないレベルに達している。他にも作曲をするAI、指示した通りにプログラミングをするAIやWebページを作成してくれるAIといったものが次々と登場している。我々は知らず知らずのうちに着実にAI時代に足を踏み入れつつある。人類は今、これからの社会をどのように設計するかを真剣に議論すべきタイミングを迎えている。

※描画AIは連日、新サービスや新たなニュースが出続けているので、皆さんがこの記事を読むタイミングでも、既に状況が大きく変わり、この記事で書いた具体的な記述が当てはまらないこともあるかも知れないので、注意して欲しい。

林信行

ITジャーナリスト

1990年から最先端の未来を取材・発信するジャーナリストとして活動を開始。アップルやグーグルなどIT大手に関する著書を多数執筆。最近は未来をつくるのはテクノロジー企業ではないと良いデザインやコンテンポラリーアートの取材に注力。リボルバー社社外取締役。金沢美術工芸大学客員教授。

Twitter / Official Site

林信行

ITジャーナリスト