文字を打ち込むと画像を作ってくれる画像生成AI。3月には自動運転スタートアップのチューリングが、画像生成AIを活用してデザインしたコンセプトカーを発表した。誰でも使えるAIは、誰でもカーデザインできることを意味するのだろうか? 試してみた。
◆Midjourneyというアプリ
チューリングのコンセプトカーの開発で、デザインを担当した開発支援企業の日南は『Stable Diffusion』というアプリを使った。しかしこれ、いろいろ調べたら、筆者のパソコンには荷が重い。動いたとしても、かなり遅くなりそうだ。
そこで選んだのが『Midjourney』だ。こちらは『Discord』というチャットサービスのなかで使う画像生成AI。クラウド上で画像生成するので、端末の性能に依存しない。スマホやタブレットでも使える。ただし『Stable Diffusion』が無料で使えるのに対して、『Midjourney』はすでに無料版の提供が打ち切られており、少なくとも10ドル/月かかる。
ネット記事を頼りに、『Midjourney』にユーザー登録。使い始めるまでに、とくに戸惑うことはない。かくして、カーデザイン評論家がカーデザインに挑戦する環境が整ったのだが…。
◆呪文の洗礼を受ける
『Stable Diffusion』もそうだが、画像生成AIではプロンプトという文字列を打ち込む。『Midjourney』は日本語に対応していないので、英語だ。やってみよう。まず打ち込んだプロンプトは…
a stylish 4-door sedan car, parked on the beach side, strong sunshine
まぁ、最初だから、デザインを提案してもらうというより、海辺に佇むクルマのきれいなイラストを期待したのだが、ほんの1~2分で提示されたのはこれだった。
プロンプトを打ち込むごとに4枚セットで画像が生成されるのだが、同じプロンプトで2度トライして、8枚の画像のうち6枚がクラシックカーだった。AIにとって「セダン」は、もはやクラシックカーなのか? それとも「ビーチサイド」という環境設定が、AIにレトロ指向させてしまったのか?
「セダン」はやめよう。環境設定ももっとモダンにしよう。そこで、こんなプロンプトを打ち込むと…
a sporty 4-door car with coupe-like silhouette, parked in city environment
「4ドア」と指定しているのに2ドアが描かれるのは、AIが「スポーティ」や「クーペライクなシルエット」といったワードを重視してしまったからかもしれない。ネット界隈ではプロンプトを「呪文」と呼ぶそうだが、いきなり呪文の唱え方の難しさに直面した。
◆AIにわかりやすい呪文とは?
プロンプトを工夫しながら何度かトライするも、なかなか思うような画像が生成されない。例えば、これだ。
ただ、期待と違う結果が出るのも、デザインする上ではまったく無用とは言えない。「これは違う」と直感することを繰り返せば、自分が心の奥底で何を求めているかがだんだん明らかになるからだ。
実際のカーデザインの現場でも、デザイナーが描くスケッチのほとんどはボツになる。ボツ案は正解を見出すための道標に他ならない。気を取り直して、新しいプロンプトを打ち込んだ。
a 4-door coupe car, futuristic and dynamic style, with simple background
それまでモダンでスポーティな4ドアを狙って試行錯誤していたが、プロンプトの最初の言葉を「4ドア・クーペ」にしたことがポイントだ。このほうがAIさんに意図が伝わりやすいかも…と考えたのだが、それが少し功を奏したようだ。納得できる画像が出てきた。
ひとつの案についてバリエーションを展開し、伸び代を見るというのは、カーデザインの現場でも行われていることだ。しかし、いくらベースのPhotoshop画像があっても、それを加工してバリエーションを作るには、1案ごとに数十分~数時間を要するはず。しかし『Midjourney』は2~3分で8案を展開してくれた。これは画像生成AIのすごさだ。
◆AIはメーカーのアイデンティティを理解している
再び気分を変えて、今度はSUVのデザインにチャレンジ。知人がかつて鉄アレイ(ダンベル)をテーマにSUVをデザインしたという話を聞いて、こんなプロンプトを打ち込んだ。
a 4-door SUV, heavy-duty style with a dumbbell-like strength, with simple background
期待に近い結果が出たが、左上の画像にシボレーのマークがあるのはなぜだろう? 「シボレー顔」は求めていないのだが…。そこで次に、プロンプトにあえてメーカー名を入れてみた。まずはトヨタだ。
a 4-door SUV, heavy-duty style with dumbbell-like volumes, like a Toyota, with simple background
トヨタのアイデンティティを踏襲しながらも、それを進化させるようなアイデアが提示されたのには少し驚いた。やればできるね、AIさん。続いて日産だ。
a 4-door SUV, heavy-duty style with dumbbell-like volumes, like a Nissan, with simple background
AIはメーカーのデザイン・アイデンティティをある程度は理解している。それはつまり各社がこれまでアイデンティティを築き上げてきた結果の反映なのだが、そこにとどまらずに何か「気付き」をもたらしてくれるのもAIの面白さだ。
プロンプトにメーカー名を入れるのは、意図する領域を絞り込む手段のひとつ。それに限らずプロンプトで狙いを巧く限定していくことができれば、画像生成AIを使って誰でもデザインの楽しさを味わえると思う。さぁ、皆さん、カーデザインにチャレンジしましょう!