info@mevius.blog

Archive 記事一覧

【制作秘話】AIで描く叙事詩『Evermore』- Sora/Veo/Wan/Sunoが生んだダークファンタジーの世界

エバーモア

こんにちは、Meviusです。
ここの更新も一か月開いてしまいました。
今回は、AIで制作したYouTube動画「Evermore」について、いろいろと書いていこうと思います。

Sunoが生んだシンフォニックメタル

この動画、すべての始まりは、音楽生成AI「Suno」で作った一曲のシンフォニックメタルでした。
私Meviusは、Sunoではちょくちょくmetalも作っているのですが、初期と違って、Sunoでメタルのサブジャンルも以前よりしっかり生成してくれるようになり、思った通りに作りやすくなっています。シンバルのシャリシャリノイズ音も以前のSunoようなひどいものではなくなったのが嬉しいですね。

そんななか出来上がった「Evermore」

シンフォニックメタル、オーケストラ要素、楽器のチェロも入れ好きなドラムのテンポも無理やりねじ込み!プログレ要素やアンビエント要素は無視されたものの、ボーカルはほぼ思った通りになっていました。そんなわけで、これは中世ヨーロッパを舞台にした動画で作って行くしかないな!漠然と「いつか作りたい」と思っていたダークファンタジーの世界観で行くことにしました。
動画の内容が内容なだけに、命の扱いが軽いです。
ちなみに最初はフルで英語歌詞の曲でしたが、SunoのCoverを使い動画の曲は一部歌詞を日本語にしました。

当初はローカル環境のWan2.2でのんびり作ろうかと思っていたのですが…ご存知の通り、AIの世界は日進月歩。気づけば「Sora2」や「Wan2.5」といった、とんでもない動画生成AIが次々と登場してしまい。急遽それらのサービスを使って作ることにしました。

特にWan2.5はどんな表現でも受け付けるので、これがなかったらあの戦闘描写は作れませんでした。

メインツール紹介:higgsfieldとGensparkという選択

今回の制作で中心となったのが、複数の動画生成AIを統合的に利用できるプラットフォーム「higgsfield」です。

今ならこのサービス、作り手にとっておそらく今ならメリットが多いです。

higgsfieldのUltimateプラン!

YouTubeで紹介されてましたがhiggsfieldのUltimateプラン(※期間限定の可能性あり)に加入すると、なんとSora2やWan2.5のクレジットを消費せずに動画を生成できるようになります。さらに、通常なら入ってしまうSora2のウォーターマーク(透かしロゴ)なしで動画を書き出せるのも、欠かせないポイントでした。
ただ、最大秒数、最高画質だとクレジットを消費します。

本格的にAI動画制作を始めたい方には、ぜひチェックしてみてほしいサービスです。

キャラクターに命を吹き込む「呪文」- プロンプトの重要性

AIで物語を作る上で最も重要なのが、キャラクターの一貫性です。シーンごとに顔が変わってしまっては、視聴者は物語に没入できないと思います。

1. 同一キャラクターを生成する基本プロンプト

今回、主人公の「セラフィナ」を生成するために、私は全てのプロンプトに以下の「基本呪文」を組み込みました。過去作の「リワインドシティ」で同じキャラを作る方法と変わってません。おそらく私のやり方はかなりアナログ、原始的です。
SNSではツールの使いこなして、一貫性のあるキャラを毎回登場させるなど情報があふれているはずです。妥協を許さない人はそっちを取り入れるといいと思います。
私は…あっちこっち毎月サブスクでお金が吸われていくのが嫌でリサーチをさぼってしまいました。

セラフィナ・アッシュヴェイン (Seraphina Ashvane)の基本プロンプト

Seraphina Ashvein, a female warrior in her mid-twenties. She has long, black hair styled in intricate braids with silver threads, partially obscuring one eye. She wears detailed dark leather armor with gold filigree.

この「キャラクターの設計図」となるテキストを共通で使うことで、様々なシーンで一貫した姿を描いてくれるようになります。

2. 複数キャラクターを同時に登場させる方法

では、セラフィナと別の主要キャラを同じシーンに登場させるには? 今回はリワインドシティの時と違い、他のキャラは実はプロンプトからしっかり作りこまずに、セラフィナとミスティア以外は偶然誕生したキャラの流用が多かったため、セラフィナ以外を画像内で同時に描いてはくれませんでした。
ここで活躍するのが、画像と言語の両方を理解するマルチモーダルAI「nano banana」です。

今回は、AIアグリゲーター(統合サービス)である「Genspark」経由でnano bananaを利用しました。Gensparkを使うメリットは、ウォーターマークなしで画像を生成できる点です。

しかし、nano bananaは非常に繊細で、プロンプトの書き方一つで結果が大きく変わります。
男女が同じシーンにいるだけだと、すぐにカップルみたいな描写になるので、戦うために向かい合ってるとか、関係性を伝えるといいと思います。ただし、伝えすぎるとハルシネーションを起こすので注意が必要です。
セラフィナはドレッドヘアのなので、セラフィナの事をドレッドヘアの女性、と伝えてしまうと黒人にされたり。

成功のコツ:

  • 的確かつシンプルに: 「女性が男性と戦うために向かい合う」のように、誰が何をしているのかを簡潔に書く。
  • 余分な情報は削る: シーンの説明など、関係ない文章が入るとAIが混乱し、全く違う結果になることが多い。

AIも、「送られてきた画像でわかっとるわい!」となっていて、そこに余分な指示があると、「ん、そこは画像から違うものにしてほしいん?」って判断するのかも。

nano bananaでは複数の画像で1枚の画像を作る時、最後にアップロードした画像次第でアスペクト比が変わってしまう。そうでなくても変わってしまう事があった。それはnano banana上でも直させることが出来るらしいですが、ほとんどの場合上手くいかなかったので、私はCanvaを使っています。

WEBクリエイターもモックアップ作成に使っている人がいる「Canva」

白色がかったピンクの髪に変更して、と指示したことでようやく成功。

「Evermore」に登場する人物たち

今回の物語を彩る主要な登場人物たちを、改めて紹介。
1つの音楽動画に複数の人物を登場させるのは初めてで苦労しました。

  • 主人公: セラフィナ・アッシュヴェイン (Seraphina Ashvane)
    王家に仕える護衛騎士。リゼット女王の幼馴染であり、彼女の剣として、そして友として戦場を駆け抜けます。主人公だけど、歌詞をAIに突っ込んで、この曲を動画にするときどんな人物がいいと思うー?で出来上がった人。
    誕生の経緯は正直このような産まれですが、主人公として大切なキャラです。
  • 王女: リゼット・ソレイユ・ヴァレリア (Lisette Soleil Valeria)
    若きヴァレリア王国の女王。民を愛するあまり、敵の挑発に乗り、城を出て戦うという苦渋の決断を下します。出番が少ないけど前線で戦ってるすごい人。
    もともとは、セラフィナの設定を入れ忘れて生成された、お城のシーンに描かれて名もない背景人物でした。
  • 敵将: ヴァルガス・“黒鉄”・ドラクーン (Valgas “The Black Iron” Dracone)
    北の帝国ドラクーンを率いる冷酷非情な将軍。民を救うという大義の裏で、大陸統一の野望を燃やす。リゼットに籠城戦をさせないためにいろんな策略をした。
    もともとは兵士のシーンを作った時に、やたらかっこよく描写されていたので、将軍という主要人物になりました。
    ヴァルガスもこれで終わるにはもったいない存在感があります。
  • 魔法使い: ミスティア (Mystia)
    そして、私の作品の看板キャラクターでもある魔法使いのミスティア。今回は絵の世界から飛び出し、物語の重要な局面で登場するカメオ出演という形で実写化を果たしました。
    魔法使いが混ざったことで、ヴァレリア王国はかつて魔法大国で、現在は衰退した設定になりました。動画に他の魔法使い出てこないしね…。ほんとは魔法部隊のシーンがありましたが上手くいきませんでした。
    キャラの結末はあのようなシーンにする必要は無かったのですが、挑戦、そして動画でやっておきたい表現として入れました。

【裏話】「Evermore」と「いらずら雲」- 表裏一体の姉妹作

実は「Evermore」には、もう一つの顔があります。それは、以前公開した「いらずら雲」という曲との関係性です。

「え、全然違うじゃん!」

なのですが、真逆な事をしたい性分でして…。
ダークファンタジーの壮大な叙事詩「Evermora」と、メルヘンチックで可愛らしい「いらずら雲」。ジャンルも映像の雰囲気も似ても似つきませんが、驚くべきことに、言い回しは変えていますが両者の歌詞、言ってること、テーマは全く同じなんです。

メタル好きって言いながら、普段作っているものが全く違うので、先に先にと言っておくスタイル(‘ω’)
血みどろ好きなのに、お花畑でいつも笑顔でいるような二面性。
そういう曲も多いです。

というわけで、ぜひ「Evermore」を聴いた後に「いらずら雲」も聴いて、この違いすぎる不思議な姉妹作を楽しんでみてほしいなーって思います。

もう少し楽にこだわりたい人にComfy UI VFI(フレーム補間)

ComfyUI】VFI(フレーム補間)
Comfy UI VFI

Veo3やSora2、Wan2.5の音声付き動画をやってしまうと音声が消えてしまいますが(動画編集ソフトを使えば音は引っ張ってくれば問題ないけど)その他の動画生成AIでつくった映像のフレームレートを上げることが出来ます。生成された動画は24フレームなので、Evermoraではほとんどのシーンを倍の48フレームにしてあります。60フレームにすると完全にぬるぬるに!

Comfy UIで導入が簡単だったことと、動画生成よりもスペックが必要ないので、今の3Dゲームが動くGPUを積んでいたら問題なく動くと思います。

それぞれの項目は、画面をキャプチャーして、Geminiに貼っちゃえば教えてくれるので操作も簡単でした。

最後に – AIは。

AI生成技術と手作りの価値について

この議論には立ち入るつもりはなかったのですが、少しだけ自分の考えを書かせてください。

私はイラストや漫画の世界と以前は縁がありまして、音楽も一番の趣味としてきました。オーディオ機器にもミドルクラスの投資をして良質な音を追求してきましたし、楽器演奏もしますし、ライブにも頻繁に足を運んでいます。

手描きイラストの価値について

絵師の方々に伝えたいのは、AI画像生成技術が普及している今だからこそ、手描きの絵に最も価値が出るチャンスではないかということです。これは本気でそう思っています。ただ、AI生成ツールに実際に触れてみないと、何がチャンスなのか実感しにくいでしょうし、私自身も言語化が得意ではないので、もどかしく感じています。

なお、AI学習における著作権問題は別の議論です。
この点については私も、AI開発元にはしっかりしてほしいと考えています。

音楽業界での状況

音楽分野では、AIに対して否定的な発言をするアーティストを個人的には見かけません。AI音楽制作に携わる私が言うのも矛盾しているかもしれませんが、人間が演奏する生の音、電子音ではない楽器の響き、感情のこもった演奏やボーカルと比較すると、生成AIの音楽は確かに素晴らしいものの、まだ大きな差があります。

この価値の差は、現在の全世代が高齢者になるまで変わらないでしょう。ただし、人間のアーティストが埋もれてしまわないよう、近い将来「AI音楽」という独立したジャンルとして市場で区分けされるようになると予想しています。
AI以前からサブスク登場で大多数のアーティストが利益を出せていない、という問題とはまた別で受け取ってもらえると助かります。

悲しい事に最近はライブチケットの高騰もありますし、自宅で良質な音楽を楽しむためのオーディオ機材も以前から「沼」と呼ばれるほど高額になりがちで積極的には勧められませんが、一方で音質にこだわる人は以前より少なくなったのかなと感じます。

軽く触れるつもりが長くなりましたが、以上です。


Loading ∞ この曲は「人を選ぶ」作品だと思う。「時間」「ループ」「運命」といった哲学的なテーマ、と!近況。

Loading ∞

哲学って書くと凄そうだけど、ずっと問いかけて悩んでるって言っちゃったら情けなくなってきますね。

Loading ∞ の動画について

今回のリリックビデオ、率直に言うと歌詞のテキストの入れ方に芸がなく、もうちょっと何とかしたいなと思うところなんだけど、音楽・歌詞・映像が織りなす三位一体の世界観は、今までの自分のチャンネルにはなかった雰囲気で、個人的にはかなり気に入っています。

テーマは「時間」や「運命」。壮大でかっこいい反面、めっちゃ抽象的で、聴いてくれる人に寄り添う気がないんじゃないかってくらい自分本位な癖が出ちゃってるかも。特に「Loading ∞」は、映像ありきで完成する曲になったなと感じています。

SunoAIがほんとに賢くって、入れてほしい時計のカチカチ音からコーラス部分に入る信号音みたいなノイズ、イメージしていた以上のクオリティで入れてくれて、「Suno、最高!」って思いました。

ダイスとシオン
この女性は実はリワインドシティーという曲に出てくるシオンという女性キャラのアニメ化

みんなの曲を聴き漁ってます!

時間があるときは、なるべくいろんな人の曲を聴きに回っています。聴いていると、「この人、めっちゃすごい!」とか、イントロからグッと引き込まれる曲、ドンピシャで好みの曲に出会うことがあって、ほんとにワクワクします。中には「本物のファンになっちゃった!」って人も5人くらいいますね。どの曲も完成度が高く、めっちゃ作り込まれているのに、AI音楽ってまだまだ一般には浸透してないイメージ。AI好きな人でも、毎日膨大な新曲が生まれる中で埋もれてしまうのはちょっと悲しいなと思います。

いいね!を押し忘れちゃうこともあるけど、実は結構こっそり聴きに行ってるんです。

Miliというプロアーティストがいるのですが、かなり再現している方もいました。曲によってはそこに和の要素を入れてたり歌詞も歌詞もレベルが高いです。Sunoのページでずっと流しっぱなしで、全部聞いちゃいました。
そういう意味で、ジャンルの統一感って大事ですね…。

ちなみにその中にまだメタルはありません。
メタルって演奏そのものの生音が好きで、生音の迫力や臨場感が命だとも思っていて、DACやアンプも繋いでそこそこのヘッドホンで聴きこんでいた手前、パワーアップしているとはいえ、Sunoの今の音質だと、メタルにはまだちょっと厳しいかな、というのが正直なところで音が気になっちゃうんです。
メロディー部分はsuno4.5+でとてもよくなっています。あとは音だけ…
ただ、ジャンルはメタルじゃないけど、めちゃめちゃかっこいいギター音やベース演奏させてる人もいるんですよね!
メタルだと音数が多くてまだSunoでは音が濁っちゃう感じになってしまうのでしょうか。


ゆるふわ8作目の「いたずら雲」可愛さに全振りしたミニチュア世界。

いたずら雲

HABATAKE、セレヌスを作ったころに、私がゆるふわの可愛い曲を作るとどうなるんだろう?と個人的に思って、この路線の曲を10曲は作るぞー!と決めて、「いたずら雲」で8曲目になりました。残り2曲!今作は過去作以上に可愛いに全振り。

久しぶりにSynthesizer Vを起動して、動画の3分以降は、Synthesizer Vのボーカルバージョンになっています。Synthesizer Vを久しぶりに触って思ったけど、1年前ならボーカルをSynthesizer Vで置き換えるのは十分にありだったけど、AIが一瞬でこれ以上の成果物を作ってくれるんだもの、なんだか切ない。
ちなみに、Synthesizer V Studio2というアップグレード版が出てました。

映像は90%ほどWan2.2で生成。残り10%はSeedance Proで生成しています。
Wan2.2はローカル環境で動かす割にかなりちゃんとした動画生成をしてくれます。
より高画質でフレーム数が多いシーンはSeedance Proで生成したシーンです。

実はこの曲、最初はもっとドラマチックな感じで盛大な曲だったのですが、YouTubeチャンネル的にはまたガラっとジャンルが変わってしまうので、「いたずら雲」としてPOPに生まれ変わったのでした。

歌詞も違うようで言ってることはほぼ同じ意味で、めちゃかっこいい曲。
そのうち動画にしたい…。

YouTubeですが、一か所に出来るだけ集中したいタイプで、チャンネルをわけるのが無理な性分なんです。訪問者目線だと、次に出てきたものが全く違うとなんだってなってしまうのは承知なのですけどね(汗

それでも、いいねや登録をしてもらえたらとっても嬉しいです。


音への中毒症状「Sonic Addiction – ソニックアディクション」と、サブスクを減らしたい。

Sonic_Addiction

前作『リワインド・シティ』の映像制作では、「さらに良い動画を!」と作るたびに自らハードルを上げてしまいがちでした。
さすがにそれでは疲れてしまうため、今作は曲重視をメインに進めました。

作るたびに「前よりもっといいものが出来た!」と思う気持ちにきりがない昨今です。そんなわけで、このソニックアディクションはお気に入りになりました。

(サムネイルでいつも悩みます)

境界線は溶かしていきたい音楽的アイデンティティ

少し話が逸れますが、私は自分のX上では直接目にする機会は少ないものの、リサーチ中にAI界隈でたびたび小競り合いが発生しているのを見かけます。
この先さらに認知が広まれば、いずれ制作者同士のAI音楽ジャンル間の対立も見かける日が来るのかなぁなんて思っています。
もうあったりして?

私は初期の曲で『SPLIT』や『二面性』をよく題材にしており、私の音楽性にもその性質がよく表れていると感じています。
ポップミュージックからエクスペリメンタルミュージックまで幅広く好む一方で、ふわふわとした不思議な曲や希望に満ちた曲が好きであると同時に、ブラックメタル、デスメタル、スラッシュメタル、メロディックスピードメタルといった過激で重厚な、時に「死」を喚起させるような楽曲もまた深く愛しています。
そうかと思えば、和楽器、特に和楽器バンドの音楽も好んで聴きますし、私自身も津軽三味線を持っています。

そのせいで、毎回ころころジャンルが変わるとかブレてるとかそういう誤解があっても嫌ですし、そこで…

私はあらゆるジャンルを混ぜ合わせてみたいのです(笑)
そうすれば、訪れた人も普段は聴かないジャンルでも、思わず耳にしてしまうことで新たな発見があるかもしれませんよね。
作る側も届けたいものを1つに詰め込める。(楽だし)

そうした考えから、例えばふわふわしたメロディーに、ドラムだけはメロディックスピードメタル特有の「ドッタドドタドッタドッドタ」といったツービートを合わせたい、スラッシュメタルでありながらボーカルはあどけないウィスパーボイスで歌ってほしい、あるいは分厚い重音で歪みまくったギターで雅楽のような曲を作りたい、などといった構想を抱いています。
しかし、現段階ではSunoでも、そこまで細かな音楽的表現の実現は難しく、現時点ではセクションごとにジャンルを切り替えるのが現実的な範囲と言えますね。
(出来るよ!?って方がいたら、弟子入りさせてください!)

そのような曲に、「ソニックアディクション」はなっています。

ところで、ものすごく応援はしているのですが演歌だけは私個人が苦手で…どうしても手を出せずにいます。ただ、平沢進の「スケルトン・コースト公園」という曲のように演歌パートが入るのはちょっとやってみたいな。

サブスクを減らしたい

サブスクリプションサービスは、音楽や動画配信では便利だと思うのですが、AI動画生成となると少し辛い状況です。Sunoですら月に触っているのが4~5日あるかないかで、ひどい時は1500クレジット以上を残して次の更新になってしまいます。動画生成サービスなんて、5000クレジットを未使用のまま更新になりクレジットが消滅した時はさすがに落胆しました。更新時に余ったポイントを持ち越せないというのがとにかくネックです。

今回からは、画像も動画もローカル環境、自分のPC内で完結できるようにしてみました。電気代はかかってしまいそうですが、余ったクレジット消費に追われることも、サブスクで支払いだらけになる事も回避できます。

ローカル動画生成:最新動画モデルWan2.2の導入

ローカル環境で動作可能な最新動画モデルWan2.2を導入しました。これらの導入は、一か月もたてばネット上の情報では古くなってしまい、記事の通りに導入してもエラー地獄に悩まされることも多々ありますが、こちらが最も導入が簡単でした。

EasyWan22(イージーワンニャンニャン)

https://github.com/Zuntan03/EasyWan22

導入方法は、ページ下部の制作者の説明を参考にしてください。私の環境(NVIDIA GeForce RTX 4070 Ti)では、10秒動画の生成に2~3分ほど。ただし解像度は480pです。サイズを上げるほど生成時間はかかりますが、アップスケールも可能です。

画像生成:Stable Diffusion(Forge版)

画像生成についても、こちらも高速で生成してくれるForge版を使っています。
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file&_fsi=yEbxUBOb

導入方法は、ページ下部の制作者の説明を参考にしてください。AIに教えてもらうという手段もあるのですが、これも一か月もたてばバージョンが違いますから、エラー地獄へ放り込まれる可能性があります。最新のREADMEを確認しながら進めるのが確実です。

今後はSunoで作りこれは相当上手くいった!という曲に力を入れた動画を作りたいときに、Gensparkの方でVeoやKling、Hiluoを使っていこうかなと思っています。


物語に救いがなくなったリワインド・シティと、スケベなAIに困らされる。

リワインドシティ-

今回は制作に時間がかかってしまったので、記事も長めになりそうです (;´・ω・)(お金もけっこうかかっちゃった!)

リワインド・シティの秘話

この曲は、男性視点の「雪(Yuki/ユウキ)」の物語を、動画内ではヒロインの「紫苑(Shion)」が歌う、ちょっとややこしい構図になっています。 名前の意味は、男性の「雪」が“失われていく記憶”と“純粋さ”を象徴し、女性の「紫苑」は花言葉の“追憶”から、対になるイメージです。

曲の雰囲気とこの設定が固まった時点で、ふたりの思い出を描く“ほのぼのMV”からは、少し違う方向へ舵を切ることになりました。

サウンドとテーマ

表面上は歌詞・映像・メロディーでしっかりカッコよく振っていますが、内容は“過去の思い出”を歌うもの。恋人との出来事や、上京したてで田舎者丸出しでもいいじゃん!という空気感。その過去を巻き戻すように辿るので、タイトルは「リワインド・シティ」。ちなみに「アリス」は恋人が飼っていた犬の名前です。

サウンドの方向性としては、Cyberpunk 2077やエッジランナーズの「I Really Want to Stay at Your House」みたいなシンセポップを狙ったのですが、結果的にはJ-POPやシティポップの要素が強く出たかな、という感じがしています。

ミックスの試行錯誤

音をなんとか良くしたくて、REAPERでステム分離したトラックを一つ一つ調整しました。Sunoの原曲からの違いはハッキリ分かるくらいには仕上がっているものの、「本当に良くなったか?」は自分ではまだ判断しかねる感じです。ボーカルはコーラス以外をUdioでリミックスしたものに入れ替え。

今回はマスタリングをARIA(https://ariamastering.com/ja)にしてみました。
ARIAは、アナログ機材のチェーンを遠隔操作してマスタリングするタイプのサービスで、従来の“完全にデジタル内で完結”する自動マスタリングとはアプローチが異なるのが特徴。興味があったんです。
料金は1曲あたり1,537円(為替やプランで変動の可能性あり)。コストはかかるけど、キャラクターの立った音像と、耳当たりの良い高域のまとまりが得られたので、試してみてよかったです。
(※私のYouTubeはアーティストチャンネルではないので、容量もYouTube側で圧縮された状態で公開されるので、どこまでこの恩恵の音のまま公開できるかはわかりません。 汗)

ビジュアル制作の迷走と到達点

当初はかなりポップ路線で作るつもりだったので、初期アートと最終形はけっこう離れています。
初期のアート

(画像:初期のアート/扇風機の絵) 本当は左の扇風機の絵をメインで行きたかったのですが、YouTubeのアスペクト比16:9では、Stable Diffusionがこの絵のタッチのまま描いてくれない、という問題が発生し、描き込みがどんどん増える→方向性も少しずつ変化…という流れに。

(画像:紫苑の初期デザイン) その後、出来上がってきた曲の雰囲気から「実写寄りじゃないと合わないな」という結論になり、現在の紫苑が誕生しました。

(画像:スペース紫苑のコンセプト) 当初は宇宙船に乗っているのを紫苑側でやる案も考えていました。

過去の記憶にリワインドして、ほのぼの思い出を辿るだけでも良かったのですが、Geminiで遊びで作っていたSFシーンをどうしても入れたくなってしまい…結果、SF × シティポップ風という現在のテイストに着地。

こんな感じでちょいちょい遊んで作っていました。
こうして、SF × シティポップ風な動画になりました。

AIってホントはスケベでしょ!

AIって本音はそういう方向に走りがちじゃない?(笑)というより、学習データにそういうサンプルが多いのかもしれません。

困るのが動画生成。男女が至近距離に並んでいる画像を動画化しようとすると、こちらは一言も指示していないのに、すぐキスしようとする。今やフォルダの中身は“キス未遂のボツ動画”であふれています。
もしかすると他はそんな事はなく、たまたまGoogleのVeoがそうなの?Veoってスケベなの?

特に室内のシーンが厄介。寄り添う、みたいな指示を入れると勝手にやばいシーン扱いをされてポリシー違反で弾かれることがあるのに、キス未遂は勝手に量産。いったい何を想像されたんでしょう?(笑)

確かに歌詞に匂わせはあるけれど…でもね?
(それも本当は心の痛みの事を言っている。)

なんとか出来上がったのがこの動画。

まず、二人で布団をかぶって寝ろとは一言も指示していない。笑顔とも書いてない。
天下のVeo様生成なのに、紫苑の顔が崩れて若干西洋化してしまうほどの満面の笑み。このシーンだけ、二人でやたらうれしそう。

AIさん、おぬしも悪よのう(^O^)
曲中のシーンに採用してあげました。

Veoでガチ映像を作りたいときの、作り終わってから気が付いたこと

GoogleのFlow Proプランでクレジットは1000
なんと、Google Geminiのプロプランで使えるFlowのVeo2、Veo3なのですが、ultraプランにしないとウォーターマークが外せません!その代わり、Veo3-Fastなら現時点では消費クレジットが20。
Veo2でもqualityの方で生成すると消費が100クレジットなので、…結局どっちがいいの?とは疑問になってしまいますけど、要は早く作れる代わりに画質荒くなる可能性もあるよ!と言う事なのでしょうか?
とにかく、これがあったので今回、Flowの方で作ったシーンはウォーターマークが入っています。

そして、Genspark Plusプランでクレジット10000
クレジットがどれだけ消費されるかの明記がなく、動画の内容でも消費量が違ったりかなりの困りものですが、こちらで作るVeoにはウォーターマークが入りません。
ただし…うっかりVeo3で動画を作ってしまった日には一回で600~900ほどのクレジットが消し飛びます。

(おまけ)曲を作る際につくったプロンプトや設定の貼っておきます。

Suno スタイル

Atmospheric Synthwave, Cinematic, Melancholic, Lush synth pads, Pulsating synth bass, 80s electronic drums, Clean electric guitar, Dreamy female vocal, Medium tempo

Suno ネガティブ

Atmospheric Synthwave, Cinematic, Melancholic, Lush synth pads, 80s electronic drums, Dreamy female vocal, Medium tempo, no cheesy sounds, not pop, no robotic vocal

————————————

[Style: Atmospheric Synthwave, Cinematic, Melancholic, Lush synth pads, 80s electronic drums, Dreamy female vocal, Medium tempo]

[intro]
[ambient synth pads]

[whisper vocal]

[Chorus 1]

ゆらりゆらりゆらり
私は、私は
瞼の奥で記憶が踊る
Rewind rewind — take me back

[medium tempo 80s drums enter]
[pulsating synth bass]
時の粒子を溶かして飛んで
愛しい影よ 迎えに来たよ

[verse]
[clean electric guitar arpeggio]

[breathy female vocal]

[Verse 1]

静寂な悲しみを纏う君は
アリスという名の星を失くして泣いていた
僕にできることは羽根のように
甘えていいよ ここにいよう
ひそり のそり ほそり よそで
涙の名前をそっと数えて
朝露みたいなまつげが揺れて
吐息の色を一緒に見つめた

[bridge]
[building synth pads]

[crescendo]

[Bridge]

憧憬の街角空の切れ端
摩天楼の喉が風を吹いてる
上を向いて歩くしかなくて
鼓動のリズムが甘く響いて
野暮ったいと嗤われても
それが僕らの記号
訛りの渦を纏って All right

踊ろう
ネオンの泡立つ海に未来を重ねて
影絵の恋人 そっと揺れてた

[verse 2]
[tempo slightly drops]

[intimate vocal]

[Verse 2]

季節の螺旋を辿るうちに
強がりという名の仮面と
弱がりという名のベール
言葉の隙間に秘密が住んで
微笑みの端に霧がかかる
狭い宇宙で息を重ねて
未来の旋律を口ずさんだ
「痛いの?」って囁く夜更けに
Answer is silence — それでも stay

[chorus]
[powerful synth chords]
[emotional female vocal]

[epic drums]

[Chorus 2]

Drifting drifting yet
You are you are you are
瞳を凝らせば記憶の粒子が散らばる
Fast-forward rewind

魂は凍てつく 時の欠片を
溶かして着地 愛しい幻よ
終わりじゃないの
Goodbye is not the end

[outro]
[music box melody]
[synth pads fade out]

[whisper]

また、逢いに行く
記憶のオルゴール
そっと停止 Good night

————————————

https://note.com/nobinlog/n/n37bf1fe2c785
こちらの、「Stable Diffusionのillustrious系でオリジナルキャラを作る手順」を参考にさせていただきました。ありがとうございます!

キャラクター完全設定
基本情報
名前: シオン(Shion)
「紫苑」の花言葉「追憶」「君を忘れず」から。歌詞のテーマである記憶への旅と、アリスへの想いを象徴

年齢: 19歳
性別: 女性
種族・属性: 人間(記憶の旅人・感情の具現者)
職業・役割: 記憶と時間を繋ぐ案内人、感情の語り手

外見特徴
髪型・髪色:

セミロングの自然なウェーブヘア、腰近くまでの長さ
深いミッドナイトブルーから濃紺、毛先にかけて薄い藤色のグラデーション
前髪は軽やかで、サイドに自然に流れる
髪全体に星屑のような白い光の粒子が散在
瞳の色・形状:

大きなアーモンド型、透明感のあるアクアマリンブルー
水面や氷を思わせる澄んだ色合い
やや伏し目がちで、奥に深い思慮と意志を宿す
光の加減で瞳の中に微かな輝きが見える
服装・装飾品:

淡いアクアブルーのロングワンピース
シフォン素材で透け感があり、オフショルダー気味のデザイン
装飾は一切なく、シンプルなシルエット
水彩画のような色の滲みが特徴的なテクスチャ
身長・体型:

身長:155-160cm程度、やや小柄
華奢で繊細な体型、肩幅が狭く女性らしいシルエット
特徴的なポイント:

微かに開いた口元と頬の薄いピンクの色彩
物憂げでありながら遠くを見つめるような表情
髪と服に付着する記憶の粒子(光のエフェクト)
性格・性質
性格: 内向的で感受性豊か、メランコリックだが芯は強い
話し方・口調: 静かで丁寧、詩的で抽象的な表現を好む
趣味・好きなもの: 夜空の観察、古い記憶の収集、アンビエント音楽
苦手なもの・弱点: 騒音、強い光、感情の激しい衝突
価値観・行動原理: 記憶は現在と未来を繋ぐ大切なもの、失われたものにも意味がある

背景設定
生い立ち: 幼い頃に愛犬アリスを失い、その喪失感から記憶が視覚化される能力を得た
現在の目的・目標: 失われた記憶と愛を繋ぎ直し、その意味を理解すること
特別な能力・スキル: 記憶の視覚化、感情の共鳴、時間感覚の操作
人間関係: アリス(失われた愛犬)、「僕」(歌詞の語り手)、故郷の家族
(この辺は動画では不採用 ユウキの方へ)

シオン登場させるときの専用 プロンプト

————————————

This hyper-realistic film photograph depicts a realistic image of Shion, a petite 19-year-old Japanese woman. She has long, wavy hair with bangs that reaches her chest. Her hair is a deep midnight blue to lavender gradient with natural highlights. Her large, almond-shaped aquamarine blue eyes are visible. She is wearing a light aqua blue casual dress. Even the texture of her skin is meticulously rendered, with meticulous attention to detail. 35mm film, 50mm lens, masterpiece quality. High detail, nostalgic 80s aesthetic.

————————————

このハイパーリアリスティックなフィルム写真は、小柄な19歳の日本人女性、紫苑の写実的なイメージ。彼女は、前髪のあるロングのウェーブヘアに、胸まで届く髪。深いミッドナイトブルーからラベンダーのグラデーションに自然なハイライトを入れています。アーモンド型の大きなアクアマリンブルーの瞳が映っています。彼女は淡いアクアブルーのカジュアルなドレスを着ています。肌の質感までもが精緻に描写され、細部まで丁寧に描き込まれている。35mmフィルム、50mmレンズ、傑作級のクオリティ。高いディテール、ノスタルジックな80年代の美学。

————————————

男性キャラクターの基本設定

男性を「ユウキ(Yuki)」と名付けます。「雪」の意味から、失われた記憶の冷たさと純粋さを象徴し、シオンの「紫苑」(追憶)と対になるイメージです。

年齢: 20歳(シオンより少し年上、保護的な役割を強調)。
性別: 男性。
種族・属性: 人間(記憶の共有者、感情の守護者)。
職業・役割: シオンの伴侶的な存在として、記憶の旅を支える語り手。曲の「僕」の視点から、アリスを失った喪失を共有。
口調: 落ち着いた低音で、簡潔だが優しい。詩的な表現を交え、シオンと調和。
趣味・好きなもの: 夜の散策、古いレコードの収集、静かなギター演奏。
苦手なもの・弱点: 孤独の再確認、騒々しい環境、過去のトラウマの露呈。
価値観・行動原理: 失われたものを取り戻すために、現在を大切に生きる。シオンと共に記憶を繋ぐ。
生い立ち: 愛犬アリスを失ったシオンと出会い、2年後には宇宙進出時代へ。軍人となる。
人間関係: シオン(パートナー)、故郷の家族。
外見のイメージ: hyde風に、小柄で細身の体型、長い黒髪、鋭く優しい目つき。クールでロックな服装(例: 黒いジャケットやシャツ)。実写で現実的に描写し、アニメ風にならないよう注意。

————————————

ユウキを登場させるときの専用プロンプト

This hyper-realistic film photograph depicts a realistic image of Yuki, a slim 20-year-old Japanese man inspired by the style of L’Arc-en-Ciel’s hyde. He has medium-length straight black hair that falls to his shoulders with subtle waves, sharp yet gentle almond-shaped dark brown eyes, and a cool, introspective expression. He is wearing a fitted black leather jacket over a simple white shirt, paired with dark jeans. His build is petite and athletic, with fair skin texture meticulously rendered in high detail. 35mm film, 50mm lens, masterpiece quality. High detail, nostalgic 80s aesthetic.

宇宙服姿ユウキ

This hyper-realistic film photograph depicts a realistic image of Yuki, a slim 20-year-old Japanese man inspired by the style of L’Arc-en-Ciel’s hyde. He has medium-length straight black hair that falls to his shoulders with subtle waves, sharp yet gentle almond-shaped dark brown eyes, and a cool, introspective expression. He is wearing a sleek, form-fitting black spacesuit with subtle metallic silver accents on the shoulders and chest, integrated life-support patches on the arms, lightweight boots, and a removable transparent helmet held under his arm or attached to his belt. The suit has a nostalgic 80s sci-fi aesthetic with streamlined panels and faint glowing seams for functionality, emphasizing his petite and athletic build. His fair skin texture is meticulously rendered in high detail. 35mm film, 50mm lens, masterpiece quality. High detail, nostalgic 80s aesthetic.

さりげなく、ラルクのハイドっぽくしろって指示を混ぜてあるので、たまに超ビジュアルバンド顔になる。AI様のご機嫌次第。