
AIがビデオスターを興奮させた:シアトルのミュージシャンが独自の技術を使って曲のイメージを生成
カート・シュロッサー著
かつて「ビデオがラジオスターを殺した」という有名な言葉がありました。皮肉にもこの歌がMTVの立ち上げに貢献してから41年が経ち、2022年の今、問われているのは、人工知能はビデオ制作者に何をもたらすのかということです。
シアトルのジェイコブ・コルカーはすでに答えを出している。
アレンAI研究所のスタートアップ・インキュベーターのマネージング・ディレクターであるコルカー氏は、ロサンゼルスを拠点とする映画製作者ニック・キング氏も所属するロック・エレクトロニック・デュオ「King//Colker」のメンバーである。
最近、二人はそれぞれの地下室から遠隔で一緒に音楽を作っており、彼らのYouTubeチャンネルは一定の成功を収め、4本のミュージックビデオで約80万回の視聴を集めている。
「人々の心の中に閉じ込められている創造性のまったく新しい世界を解き放つのです。」
最新のビデオ(上記)は「Moment」という曲のもので、コルカーが週末にかけて制作したハイテクな作品です。月曜日に投稿されたこのビデオは、そのユニークな制作方法もあってか、瞬く間に15万回再生を記録しました。
コルカー氏は、サンフランシスコの AI 研究機関 OpenAI の新しいシステムである DALL-E 2 のプライベート ベータ版にアクセスできました。このシステムは、以前のリリースである DALL-E 1 を改良したものです。
DALL-E 2は、シンプルな自然言語による説明を、リアルな画像やアート作品に変換できます。視覚表現を向上させるだけでなく、AIが世界をどのように見ているかを人間に教えるために設計されたこの技術については、こちらのYouTube動画で解説されています。バイクに乗るコアラのアート作品がどのようなものなのか、ぜひご覧ください。
「これはサイドプロジェクトなので、使えるツールは限られており、制作予算もゼロですが、ミュージックビデオを作るための創造的な方法を見つけようとしました」とコルカー氏は語った。

コルカー氏とキング氏は、以前趣味でiPhoneでビデオを撮影した後、人間の人生のさまざまな章を歌った曲「Moment」にアニメーションを使用したいと考えました。
コルカー氏はDALL-E 2を使って、「青い髪のティーンエイジャーが両親と遊んでいるサイバーパンク風の絵画」といったキーワードを入力する。システムはそれらの条件に合う画像を生成し、最終的にコルカー氏が200枚以上の「絵画」をつなぎ合わせたカラフルな動画の1フレームを提供する。
「テクノロジーとAI、そして音楽という私の2つの世界を融合させるのは楽しい瞬間でした」とコルカー氏は語った。
Instagram、TikTok、そしてあらゆる種類のテクノロジーの時代に、コルカーの作品の矢継ぎ早に繰り出されるイメージは、たとえ「スリラー」から「スメルズ・ライク・ティーン・スピリット」など、世代を定義したMTVと映画のようなミュージックビデオの全盛期からの奇妙な進化のように感じられるとしても、理にかなっているように思える。
しかし、コルカー氏はパートタイムのクリエイターであるため、プロのイラストレーターやクリエイティブスタジオに依頼してイラスト制作を依頼するほどの資金はないと語った。彼はこの技術を、15年前のiPhoneに匹敵する画期的な進歩だと捉えており、ポケットの中のデバイスで素晴らしい写真が作れるようになったと述べている。
「この作品は、作品を発表する価値があるのに、他の人ほどの制作予算がない人々の心の奥底に閉じ込められている、全く新しい創造性の世界を開くものです」とコルカー氏はDALL-E 2について語った。「これは本当に力強いことだと思います」
MTV を賑わせたヒット曲の歌詞をアップデートする時が来ました…
AIはビデオスターを興奮させた。
私の心と車の中で、
巻き戻すことはできません。私たちは行き過ぎてしまいました。