誰でもカーデザイナーになれる？「画像生成AI」にクルマを描かせてみた

文字を打ち込むと画像を作ってくれる画像生成AI。3月には自動運転スタートアップのチューリングが、画像生成AIを活用してデザインしたコンセプトカーを発表した。誰でも使えるAIは、誰でもカーデザインできることを意味するのだろうか？　試してみた。

◆Midjourneyというアプリ

チューリングのコンセプトカーの開発で、デザインを担当した開発支援企業の日南は『Stable Diffusion』というアプリを使った。しかしこれ、いろいろ調べたら、筆者のパソコンには荷が重い。動いたとしても、かなり遅くなりそうだ。

そこで選んだのが『Midjourney』だ。こちらは『Discord』というチャットサービスのなかで使う画像生成AI。クラウド上で画像生成するので、端末の性能に依存しない。スマホやタブレットでも使える。ただし『Stable Diffusion』が無料で使えるのに対して、『Midjourney』はすでに無料版の提供が打ち切られており、少なくとも10ドル／月かかる。

ネット記事を頼りに、『Midjourney』にユーザー登録。使い始めるまでに、とくに戸惑うことはない。かくして、カーデザイン評論家がカーデザインに挑戦する環境が整ったのだが…。

◆呪文の洗礼を受ける

『Stable Diffusion』もそうだが、画像生成AIではプロンプトという文字列を打ち込む。『Midjourney』は日本語に対応していないので、英語だ。やってみよう。まず打ち込んだプロンプトは…

a stylish 4-door sedan car, parked on the beach side, strong sunshine

まぁ、最初だから、デザインを提案してもらうというより、海辺に佇むクルマのきれいなイラストを期待したのだが、ほんの1～2分で提示されたのはこれだった。

「スタイリッシュな4ドア・セダン」というプロンプトに対して、なぜかクラシックカーの画像が提示された。左が1回目、右は同じプロンプトで再トライしたもの。

プロンプトを打ち込むごとに4枚セットで画像が生成されるのだが、同じプロンプトで2度トライして、8枚の画像のうち6枚がクラシックカーだった。AIにとって「セダン」は、もはやクラシックカーなのか？　それとも「ビーチサイド」という環境設定が、AIにレトロ指向させてしまったのか？

「セダン」はやめよう。環境設定ももっとモダンにしよう。そこで、こんなプロンプトを打ち込むと…

a sporty 4-door car with coupe-like silhouette, parked in city environment

これも同じプロンプトで2度、画像生成した。左の右下は、なぜか70年代風のスタイルだし、4ドアと言っているのに2ドア。右の左下も2ドアだ。

「4ドア」と指定しているのに2ドアが描かれるのは、AIが「スポーティ」や「クーペライクなシルエット」といったワードを重視してしまったからかもしれない。ネット界隈ではプロンプトを「呪文」と呼ぶそうだが、いきなり呪文の唱え方の難しさに直面した。

◆AIにわかりやすい呪文とは？

プロンプトを工夫しながら何度かトライするも、なかなか思うような画像が生成されない。例えば、これだ。

画像に書き添えた文字列がプロンプト。左の「フューチャリスティック＆シンプル・スタイル」では期待したほど新鮮でもシンプルでもなかったので、右は文体を変えつつ、「シンプル」より意味の強い「ミニマリスト」にしてみたのだが、やはりあまりシンプルにはならなかった。

ただ、期待と違う結果が出るのも、デザインする上ではまったく無用とは言えない。「これは違う」と直感することを繰り返せば、自分が心の奥底で何を求めているかがだんだん明らかになるからだ。

実際のカーデザインの現場でも、デザイナーが描くスケッチのほとんどはボツになる。ボツ案は正解を見出すための道標に他ならない。気を取り直して、新しいプロンプトを打ち込んだ。

a 4-door coupe car, futuristic and dynamic style, with simple background

それまでモダンでスポーティな4ドアを狙って試行錯誤していたが、プロンプトの最初の言葉を「4ドア・クーペ」にしたことがポイントだ。このほうがAIさんに意図が伝わりやすいかも…と考えたのだが、それが少し功を奏したようだ。納得できる画像が出てきた。

気に入った画像のバリエーションを、AIに展開させることもできる。ここでは2回クリックし、計8パターンを生成。顔付きやインテークなどのディテールがそれぞれ異なる。

ひとつの案についてバリエーションを展開し、伸び代を見るというのは、カーデザインの現場でも行われていることだ。しかし、いくらベースのPhotoshop画像があっても、それを加工してバリエーションを作るには、1案ごとに数十分～数時間を要するはず。しかし『Midjourney』は2～3分で8案を展開してくれた。これは画像生成AIのすごさだ。

◆AIはメーカーのアイデンティティを理解している

再び気分を変えて、今度はSUVのデザインにチャレンジ。知人がかつて鉄アレイ（ダンベル）をテーマにSUVをデザインしたという話を聞いて、こんなプロンプトを打ち込んだ。

a 4-door SUV, heavy-duty style with a dumbbell-like strength, with simple background

いかにもヘビーデューティなSUVの画像が生成された。なお、これまでは個々の画像が正方形だったが、縦横比を変えるコマンドがあることに気付いたので16：9にしている。

期待に近い結果が出たが、左上の画像にシボレーのマークがあるのはなぜだろう？　「シボレー顔」は求めていないのだが…。そこで次に、プロンプトにあえてメーカー名を入れてみた。まずはトヨタだ。

a 4-door SUV, heavy-duty style with dumbbell-like volumes, like a Toyota, with simple background

4点ともトヨタの北米向けSUVのフロント・アイデンティティを表現。左上画像のグリルとその両脇のインテークの立体的な組み合わせ方は興味深いし、右下画像のフロントコーナーに配された縦長ガードバーも斬新だ。

トヨタのアイデンティティを踏襲しながらも、それを進化させるようなアイデアが提示されたのには少し驚いた。やればできるね、AIさん。続いて日産だ。

a 4-door SUV, heavy-duty style with dumbbell-like volumes, like a Nissan, with simple background

日産の「Vモーショングリル」を踏襲しながら、エクストレイルともパトロールとも違う画像が生成された。

AIはメーカーのデザイン・アイデンティティをある程度は理解している。それはつまり各社がこれまでアイデンティティを築き上げてきた結果の反映なのだが、そこにとどまらずに何か「気付き」をもたらしてくれるのもAIの面白さだ。

プロンプトにメーカー名を入れるのは、意図する領域を絞り込む手段のひとつ。それに限らずプロンプトで狙いを巧く限定していくことができれば、画像生成AIを使って誰でもデザインの楽しさを味わえると思う。さぁ、皆さん、カーデザインにチャレンジしましょう！