info@mevius.blog

2025年の記事一覧

グリッチポップ×メタル!? 右へ倣えが出来ない「Yes Yes – Good Boy. Error」

Yes Yes - Good Boy. Error

「Yes Yes – Good Boy. Error」は、Xにも書いたのですが、間奏だけメタルにしたり独自路線を模索中の尖った曲。以前の「ソニックアディクション」という曲でも同じ試みをしていますが、ソニックアディクションは前半がエレクトロポップ、後半がメロディックスピードメタルへと展開する曲でした。

最近は仕事やらで少し疲れているようで、歌詞にその影響がフルに出ています。

当初は、自分の中でお気に入りの「HABATAKE」と「Loading ∞」という2曲の要素をミックスし、いいとこ取りをした楽曲を作ろうと思っていました。その名残「カチ…カチ…」という謎のフレーズが所々に残っています。
Suno AIが歌詞に書いていない部分でも勝手に「カチカチ」と歌わせていたり、ほかにも意味不明なフレーズが入ってしまったりしています。DAWで編集すればいくらでもそこだけ取り除けたのですが、今回は曲のテーマが「Error」ということもあり、あえてそのまま残してみました。
不思議なニュアンスとして聴いてもらえたら嬉しいです。

曲は間奏でフラストレーションの爆発、Industrial Metalへと変わり、その後落ち着きを取り戻し後半を迎えます。

新しい試み

今回はいつもの動画生成AIだけでなく、WebGLのシーンがあります。
nano Banana pro、Grok imagineの導入など。

タイトルの「Yes Yes – Good Boy. Error」のErrorには、はみで者という意味を持たせています。

リワインド・シティのSionさん、Loading ∞に引き続き登場です。
未使用動画があまりにも多くなってしまったため、ここに貼っておきます。



「トランスパレント 」Spiral Part1と、「リフレクション」 Spiral Part2

トランスパレント Spiral Part1と、リフレクション Spiral Part2

パート1とパート2で物語が続く楽曲です。

初めてMidjourneyを利用しました。動画部分はMidjourneyとGrok Imagineを使用しています。この曲を制作していた時期は、LLMや動画生成AIの新バージョンラッシュが重なり、さらに動画編集に使用しているFilmoraも大幅なアップデートでFilmora 15になるなど、周囲の動きも目まぐるしく、把握すべきことが多い大変な時期でした。

今作「トランスパレント Spiral Part1」は、初期の頃の私のチャンネルの作風・雰囲気を意識しつつ、現在のやり方で制作した作品です。「透明になりそうなほど頼りない存在(私)が、言葉や時間の海を漂いながら、傷つくことを恐れずに『君』や『光』という確かなものを求めて一歩を踏み出す物語」になっています。

当初はイメージや抽象的な描写だけにするつもりでしたが、後からアニメ描写を追加しました。アニメ部分はスマートフォンの画面に映し出されるという演出になっており、背景とシンクロした動きに気を配っています。

続いて、「リフレクション Spiral Part2」です。

実験的にFlova AIを動画に使用しましたが、自前で用意したMidjourney生成のイラスト・動画の方が見栄え的にも美しく、Flova AIで作成したシーンはオーバーレイでうっすら背景に見えるという演出にしています。使いこなせたら違ってくるのかもしれません。

この曲は、「透明だった存在が、他者との関わり(反射)を通じて『色』と『輪郭』を獲得し、生の実感を噛み締めながら共に踊り出す(生きる)までの再生の物語」です。

Part2を制作することになったのは、もともとトランスパレント用に出来上がっていたメロディーがあったからです。出来は良かったものの、迷いに迷って採用されなかった方をPart2として再利用しました。採用しなかった他の理由としては、歌詞の誤発音や漢字の読み間違いが多く、修正するよりも別曲としてカバーした方が早かったためです。

最近は、ものすごく作り込む方や斬新なアイデア、高いクオリティの動画を作る人が現れ始め、いよいよ本格的な競争が始まっていくと感じています。すでにスタート時点で、そういった方々ははるか先を行っていますが。それに加えてAIの進化も速いため、私の作風ももう古いなと感じています。

作業をAIが担うようになると、私たちはアイデア出しに頭をフル回転させていくしかありません。
のんびりしていてはトランスパレントになってしまいます。
常に、リフレインを求め続けて全身し続けるしかありませんね!


『点描遊戯絵巻』はマ〇オの活躍するゲームを初めて触った時の歌、Suno初期の曲の作り直し。

点描遊戯絵巻

点描遊戯絵巻は、Sunoを初めて触りだしてすぐに作った「最初のクリボー」という、幼少期の初めてTVゲームに触れた時の事を歌にしたシンプルでコミカルな曲を、最新のSuno v5で作り直したものです。
「最初のクリボー」ってタイトル通りの曲なのですが、当時「Sunoって和楽器の音をどこまで表現できるんだろう?」という好奇心もあって、三味線の演奏が入っている曲でした。

当初は軽く、今のv5の音に変えるだけでいいと思っていたのですが、和ロック要素を入れたところ…演奏がかっこよくなりすぎて…。
コミカルな内容の歌詞と合わなくなってしまい、歌詞の言い回しを和風にし今の形に落ち着きました

動画は様々なパロディー+最新のSora2やVeo3.1の生成結果に任せ放題。
アニメが苦手っぽく、キャラが急に実写化し出すのはVeo3.1。
実写化はしないが、出来栄えにムラがあるのが、イラストのimage to videoだと安定しないSora2。
これはProでもあまり差を感じられませんでした。
悔しいけど(?)万能なのがWan2.5。
そして、お手軽で安定のGrokでの動画生成。
これらで出来上がっています。

Sora2(かっこいいけど結構ガチャ要素あり)

Veo3.1(凄いんだけど使いどころに困るし…)

三味線の糸巻の本数やバチの形、ボーカルの女性が和太鼓も叩いてたり全体で突っ込みどころも多いですが、直そうと思ったころにはSoraもVeoも生成し放題の期間が終わっており、そのままになりました!
AIの「癖」が強く出た部分も含めて、楽しんでいただけると嬉しいです!<(_ _)>

ちなみに、見どころ聴きどころは「間奏」部分です!!
三味線、ギター、尺初の掛け合いがたまらないです。


【制作秘話】AIで描く叙事詩『Evermore』- Sora/Veo/Wan/Sunoが生んだダークファンタジーの世界

evemore

こんにちは、Meviusです。
ここの更新も一か月開いてしまいました。
今回は、AIで制作したYouTube動画「Evermore」について、いろいろと書いていこうと思います。

Sunoが生んだシンフォニックメタル

この動画、すべての始まりは、音楽生成AI「Suno」で作った一曲のシンフォニックメタルでした。
私Meviusは、Sunoではちょくちょくmetalも作っているのですが、初期と違って、Sunoでメタルのサブジャンルも以前よりしっかり生成してくれるようになり、思った通りに作りやすくなっています。シンバルのシャリシャリノイズ音も以前のSunoようなひどいものではなくなったのが嬉しいですね。

そんななか出来上がった「Evermore」

シンフォニックメタル、オーケストラ要素、楽器のチェロも入れ好きなドラムのテンポも無理やりねじ込み!プログレ要素やアンビエント要素は無視されたものの、ボーカルはほぼ思った通りになっていました。そんなわけで、これは中世ヨーロッパを舞台にした動画で作って行くしかないな!漠然と「いつか作りたい」と思っていたダークファンタジーの世界観で行くことにしました。
動画の内容が内容なだけに、命の扱いが軽いです。
ちなみに最初はフルで英語歌詞の曲でしたが、SunoのCoverを使い動画の曲は一部歌詞を日本語にしました。

当初はローカル環境のWan2.2でのんびり作ろうかと思っていたのですが…ご存知の通り、AIの世界は日進月歩。気づけば「Sora2」や「Wan2.5」といった、とんでもない動画生成AIが次々と登場してしまい。急遽それらのサービスを使って作ることにしました。

特にWan2.5はどんな表現でも受け付けるので、これがなかったらあの戦闘描写は作れませんでした。

メインツール紹介:higgsfieldとGensparkという選択

今回の制作で中心となったのが、複数の動画生成AIを統合的に利用できるプラットフォーム「higgsfield」です。

今ならこのサービス、作り手にとっておそらく今ならメリットが多いです。

higgsfieldのUltimateプラン!

YouTubeで紹介されてましたがhiggsfieldのUltimateプラン(※期間限定の可能性あり)に加入すると、なんとSora2やWan2.5のクレジットを消費せずに動画を生成できるようになります。さらに、通常なら入ってしまうSora2のウォーターマーク(透かしロゴ)なしで動画を書き出せるのも、欠かせないポイントでした。
ただ、最大秒数、最高画質だとクレジットを消費します。

本格的にAI動画制作を始めたい方には、ぜひチェックしてみてほしいサービスです。

キャラクターに命を吹き込む「呪文」- プロンプトの重要性

AIで物語を作る上で最も重要なのが、キャラクターの一貫性です。シーンごとに顔が変わってしまっては、視聴者は物語に没入できないと思います。

1. 同一キャラクターを生成する基本プロンプト

今回、主人公の「セラフィナ」を生成するために、私は全てのプロンプトに以下の「基本呪文」を組み込みました。過去作の「リワインドシティ」で同じキャラを作る方法と変わってません。おそらく私のやり方はかなりアナログ、原始的です。
SNSではツールの使いこなして、一貫性のあるキャラを毎回登場させるなど情報があふれているはずです。妥協を許さない人はそっちを取り入れるといいと思います。
私は…あっちこっち毎月サブスクでお金が吸われていくのが嫌でリサーチをさぼってしまいました。

セラフィナ・アッシュヴェイン (Seraphina Ashvane)の基本プロンプト

Seraphina Ashvein, a female warrior in her mid-twenties. She has long, black hair styled in intricate braids with silver threads, partially obscuring one eye. She wears detailed dark leather armor with gold filigree.

この「キャラクターの設計図」となるテキストを共通で使うことで、様々なシーンで一貫した姿を描いてくれるようになります。

2. 複数キャラクターを同時に登場させる方法

では、セラフィナと別の主要キャラを同じシーンに登場させるには? 今回はリワインドシティの時と違い、他のキャラは実はプロンプトからしっかり作りこまずに、セラフィナとミスティア以外は偶然誕生したキャラの流用が多かったため、セラフィナ以外を画像内で同時に描いてはくれませんでした。
ここで活躍するのが、画像と言語の両方を理解するマルチモーダルAI「nano banana」です。

今回は、AIアグリゲーター(統合サービス)である「Genspark」経由でnano bananaを利用しました。Gensparkを使うメリットは、ウォーターマークなしで画像を生成できる点です。

しかし、nano bananaは非常に繊細で、プロンプトの書き方一つで結果が大きく変わります。
男女が同じシーンにいるだけだと、すぐにカップルみたいな描写になるので、戦うために向かい合ってるとか、関係性を伝えるといいと思います。ただし、伝えすぎるとハルシネーションを起こすので注意が必要です。
セラフィナはドレッドヘアのなので、セラフィナの事をドレッドヘアの女性、と伝えてしまうと黒人にされたり。

成功のコツ:

  • 的確かつシンプルに: 「女性が男性と戦うために向かい合う」のように、誰が何をしているのかを簡潔に書く。
  • 余分な情報は削る: シーンの説明など、関係ない文章が入るとAIが混乱し、全く違う結果になることが多い。

AIも、「送られてきた画像でわかっとるわい!」となっていて、そこに余分な指示があると、「ん、そこは画像から違うものにしてほしいん?」って判断するのかも。

nano bananaでは複数の画像で1枚の画像を作る時、最後にアップロードした画像次第でアスペクト比が変わってしまう。そうでなくても変わってしまう事があった。それはnano banana上でも直させることが出来るらしいですが、ほとんどの場合上手くいかなかったので、私はCanvaを使っています。

WEBクリエイターもモックアップ作成に使っている人がいる「Canva」

白色がかったピンクの髪に変更して、と指示したことでようやく成功。

「Evermore」に登場する人物たち

今回の物語を彩る主要な登場人物たちを、改めて紹介。
1つの音楽動画に複数の人物を登場させるのは初めてで苦労しました。

  • 主人公: セラフィナ・アッシュヴェイン (Seraphina Ashvane)
    王家に仕える護衛騎士。リゼット女王の幼馴染であり、彼女の剣として、そして友として戦場を駆け抜けます。主人公だけど、歌詞をAIに突っ込んで、この曲を動画にするときどんな人物がいいと思うー?で出来上がった人。
    誕生の経緯は正直このような産まれですが、主人公として大切なキャラです。
  • 王女: リゼット・ソレイユ・ヴァレリア (Lisette Soleil Valeria)
    若きヴァレリア王国の女王。民を愛するあまり、敵の挑発に乗り、城を出て戦うという苦渋の決断を下します。出番が少ないけど前線で戦ってるすごい人。
    もともとは、セラフィナの設定を入れ忘れて生成された、お城のシーンに描かれて名もない背景人物でした。
  • 敵将: ヴァルガス・“黒鉄”・ドラクーン (Valgas “The Black Iron” Dracone)
    北の帝国ドラクーンを率いる冷酷非情な将軍。民を救うという大義の裏で、大陸統一の野望を燃やす。リゼットに籠城戦をさせないためにいろんな策略をした。
    もともとは兵士のシーンを作った時に、やたらかっこよく描写されていたので、将軍という主要人物になりました。
    ヴァルガスもこれで終わるにはもったいない存在感があります。
  • 魔法使い: ミスティア (Mystia)
    そして、私の作品の看板キャラクターでもある魔法使いのミスティア。今回は絵の世界から飛び出し、物語の重要な局面で登場するカメオ出演という形で実写化を果たしました。
    魔法使いが混ざったことで、ヴァレリア王国はかつて魔法大国で、現在は衰退した設定になりました。動画に他の魔法使い出てこないしね…。ほんとは魔法部隊のシーンがありましたが上手くいきませんでした。
    キャラの結末はあのようなシーンにする必要は無かったのですが、挑戦、そして動画でやっておきたい表現として入れました。

【裏話】「Evermore」と「いらずら雲」- 表裏一体の姉妹作

実は「Evermore」には、もう一つの顔があります。それは、以前公開した「いらずら雲」という曲との関係性です。

「え、全然違うじゃん!」

なのですが、真逆な事をしたい性分でして…。
ダークファンタジーの壮大な叙事詩「Evermora」と、メルヘンチックで可愛らしい「いらずら雲」。ジャンルも映像の雰囲気も似ても似つきませんが、驚くべきことに、言い回しは変えていますが両者の歌詞、言ってること、テーマは全く同じなんです。

メタル好きって言いながら、普段作っているものが全く違うので、先に先にと言っておくスタイル(‘ω’)
血みどろ好きなのに、お花畑でいつも笑顔でいるような二面性。
そういう曲も多いです。

というわけで、ぜひ「Evermore」を聴いた後に「いらずら雲」も聴いて、この違いすぎる不思議な姉妹作を楽しんでみてほしいなーって思います。

もう少し楽にこだわりたい人にComfy UI VFI(フレーム補間)

ComfyUI】VFI(フレーム補間)
Comfy UI VFI

Veo3やSora2、Wan2.5の音声付き動画をやってしまうと音声が消えてしまいますが(動画編集ソフトを使えば音は引っ張ってくれば問題ないけど)その他の動画生成AIでつくった映像のフレームレートを上げることが出来ます。生成された動画は24フレームなので、Evermoraではほとんどのシーンを倍の48フレームにしてあります。60フレームにすると完全にぬるぬるに!

Comfy UIで導入が簡単だったことと、動画生成よりもスペックが必要ないので、今の3Dゲームが動くGPUを積んでいたら問題なく動くと思います。

それぞれの項目は、画面をキャプチャーして、Geminiに貼っちゃえば教えてくれるので操作も簡単でした。

最後に – AIは。

AI生成技術と手作りの価値について

この議論には立ち入るつもりはなかったのですが、少しだけ自分の考えを書かせてください。

私はイラストや漫画の世界と以前は縁がありまして、音楽も一番の趣味としてきました。オーディオ機器にもミドルクラスの投資をして良質な音を追求してきましたし、楽器演奏もしますし、ライブにも頻繁に足を運んでいます。

手描きイラストの価値について

絵師の方々に伝えたいのは、AI画像生成技術が普及している今だからこそ、手描きの絵に最も価値が出るチャンスではないかということです。これは本気でそう思っています。ただ、AI生成ツールに実際に触れてみないと、何がチャンスなのか実感しにくいでしょうし、私自身も言語化が得意ではないので、もどかしく感じています。

なお、AI学習における著作権問題は別の議論です。
この点については私も、AI開発元にはしっかりしてほしいと考えています。

音楽業界での状況

音楽分野では、AIに対して否定的な発言をするアーティストを個人的には見かけません。AI音楽制作に携わる私が言うのも矛盾しているかもしれませんが、人間が演奏する生の音、電子音ではない楽器の響き、感情のこもった演奏やボーカルと比較すると、生成AIの音楽は確かに素晴らしいものの、まだ大きな差があります。

この価値の差は、現在の全世代が高齢者になるまで変わらないでしょう。ただし、人間のアーティストが埋もれてしまわないよう、近い将来「AI音楽」という独立したジャンルとして市場で区分けされるようになると予想しています。
AI以前からサブスク登場で大多数のアーティストが利益を出せていない、という問題とはまた別で受け取ってもらえると助かります。

悲しい事に最近はライブチケットの高騰もありますし、自宅で良質な音楽を楽しむためのオーディオ機材も以前から「沼」と呼ばれるほど高額になりがちで積極的には勧められませんが、一方で音質にこだわる人は以前より少なくなったのかなと感じます。

軽く触れるつもりが長くなりましたが、以上です。


Loading ∞ この曲は「人を選ぶ」作品だと思う。「時間」「ループ」「運命」といった哲学的なテーマ、と!近況。

Loading ∞

哲学って書くと凄そうだけど、ずっと問いかけて悩んでるって言っちゃったら情けなくなってきますね。

Loading ∞ の動画について

今回のリリックビデオ、率直に言うと歌詞のテキストの入れ方に芸がなく、もうちょっと何とかしたいなと思うところなんだけど、音楽・歌詞・映像が織りなす三位一体の世界観は、今までの自分のチャンネルにはなかった雰囲気で、個人的にはかなり気に入っています。

テーマは「時間」や「運命」。壮大でかっこいい反面、めっちゃ抽象的で、聴いてくれる人に寄り添う気がないんじゃないかってくらい自分本位な癖が出ちゃってるかも。特に「Loading ∞」は、映像ありきで完成する曲になったなと感じています。

SunoAIがほんとに賢くって、入れてほしい時計のカチカチ音からコーラス部分に入る信号音みたいなノイズ、イメージしていた以上のクオリティで入れてくれて、「Suno、最高!」って思いました。

ダイスとシオン
この女性は実はリワインドシティーという曲に出てくるシオンという女性キャラのアニメ化

みんなの曲を聴き漁ってます!

時間があるときは、なるべくいろんな人の曲を聴きに回っています。聴いていると、「この人、めっちゃすごい!」とか、イントロからグッと引き込まれる曲、ドンピシャで好みの曲に出会うことがあって、ほんとにワクワクします。中には「本物のファンになっちゃった!」って人も5人くらいいますね。どの曲も完成度が高く、めっちゃ作り込まれているのに、AI音楽ってまだまだ一般には浸透してないイメージ。AI好きな人でも、毎日膨大な新曲が生まれる中で埋もれてしまうのはちょっと悲しいなと思います。

いいね!を押し忘れちゃうこともあるけど、実は結構こっそり聴きに行ってるんです。

Miliというプロアーティストがいるのですが、かなり再現している方もいました。曲によってはそこに和の要素を入れてたり歌詞も歌詞もレベルが高いです。Sunoのページでずっと流しっぱなしで、全部聞いちゃいました。
そういう意味で、ジャンルの統一感って大事ですね…。

ちなみにその中にまだメタルはありません。
メタルって演奏そのものの生音が好きで、生音の迫力や臨場感が命だとも思っていて、DACやアンプも繋いでそこそこのヘッドホンで聴きこんでいた手前、パワーアップしているとはいえ、Sunoの今の音質だと、メタルにはまだちょっと厳しいかな、というのが正直なところで音が気になっちゃうんです。
メロディー部分はsuno4.5+でとてもよくなっています。あとは音だけ…
ただ、ジャンルはメタルじゃないけど、めちゃめちゃかっこいいギター音やベース演奏させてる人もいるんですよね!
メタルだと音数が多くてまだSunoでは音が濁っちゃう感じになってしまうのでしょうか。


ゆるふわ8作目の「いたずら雲」可愛さに全振りしたミニチュア世界。

いたずら雲

HABATAKE、セレヌスを作ったころに、私がゆるふわの可愛い曲を作るとどうなるんだろう?と個人的に思って、この路線の曲を10曲は作るぞー!と決めて、「いたずら雲」で8曲目になりました。残り2曲!今作は過去作以上に可愛いに全振り。

久しぶりにSynthesizer Vを起動して、動画の3分以降は、Synthesizer Vのボーカルバージョンになっています。Synthesizer Vを久しぶりに触って思ったけど、1年前ならボーカルをSynthesizer Vで置き換えるのは十分にありだったけど、AIが一瞬でこれ以上の成果物を作ってくれるんだもの、なんだか切ない。
ちなみに、Synthesizer V Studio2というアップグレード版が出てました。

映像は90%ほどWan2.2で生成。残り10%はSeedance Proで生成しています。
Wan2.2はローカル環境で動かす割にかなりちゃんとした動画生成をしてくれます。
より高画質でフレーム数が多いシーンはSeedance Proで生成したシーンです。

実はこの曲、最初はもっとドラマチックな感じで盛大な曲だったのですが、YouTubeチャンネル的にはまたガラっとジャンルが変わってしまうので、「いたずら雲」としてPOPに生まれ変わったのでした。

歌詞も違うようで言ってることはほぼ同じ意味で、めちゃかっこいい曲。
そのうち動画にしたい…。

YouTubeですが、一か所に出来るだけ集中したいタイプで、チャンネルをわけるのが無理な性分なんです。訪問者目線だと、次に出てきたものが全く違うとなんだってなってしまうのは承知なのですけどね(汗

それでも、いいねや登録をしてもらえたらとっても嬉しいです。


音への中毒症状「Sonic Addiction – ソニックアディクション」と、サブスクを減らしたい。

Sonic_Addiction

前作『リワインド・シティ』の映像制作では、「さらに良い動画を!」と作るたびに自らハードルを上げてしまいがちでした。
さすがにそれでは疲れてしまうため、今作は曲重視をメインに進めました。

作るたびに「前よりもっといいものが出来た!」と思う気持ちにきりがない昨今です。そんなわけで、このソニックアディクションはお気に入りになりました。

(サムネイルでいつも悩みます)

境界線は溶かしていきたい音楽的アイデンティティ

少し話が逸れますが、私は自分のX上では直接目にする機会は少ないものの、リサーチ中にAI界隈でたびたび小競り合いが発生しているのを見かけます。
この先さらに認知が広まれば、いずれ制作者同士のAI音楽ジャンル間の対立も見かける日が来るのかなぁなんて思っています。
もうあったりして?

私は初期の曲で『SPLIT』や『二面性』をよく題材にしており、私の音楽性にもその性質がよく表れていると感じています。
ポップミュージックからエクスペリメンタルミュージックまで幅広く好む一方で、ふわふわとした不思議な曲や希望に満ちた曲が好きであると同時に、ブラックメタル、デスメタル、スラッシュメタル、メロディックスピードメタルといった過激で重厚な、時に「死」を喚起させるような楽曲もまた深く愛しています。
そうかと思えば、和楽器、特に和楽器バンドの音楽も好んで聴きますし、私自身も津軽三味線を持っています。

そのせいで、毎回ころころジャンルが変わるとかブレてるとかそういう誤解があっても嫌ですし、そこで…

私はあらゆるジャンルを混ぜ合わせてみたいのです(笑)
そうすれば、訪れた人も普段は聴かないジャンルでも、思わず耳にしてしまうことで新たな発見があるかもしれませんよね。
作る側も届けたいものを1つに詰め込める。(楽だし)

そうした考えから、例えばふわふわしたメロディーに、ドラムだけはメロディックスピードメタル特有の「ドッタドドタドッタドッドタ」といったツービートを合わせたい、スラッシュメタルでありながらボーカルはあどけないウィスパーボイスで歌ってほしい、あるいは分厚い重音で歪みまくったギターで雅楽のような曲を作りたい、などといった構想を抱いています。
しかし、現段階ではSunoでも、そこまで細かな音楽的表現の実現は難しく、現時点ではセクションごとにジャンルを切り替えるのが現実的な範囲と言えますね。
(出来るよ!?って方がいたら、弟子入りさせてください!)

そのような曲に、「ソニックアディクション」はなっています。

ところで、ものすごく応援はしているのですが演歌だけは私個人が苦手で…どうしても手を出せずにいます。ただ、平沢進の「スケルトン・コースト公園」という曲のように演歌パートが入るのはちょっとやってみたいな。

サブスクを減らしたい

サブスクリプションサービスは、音楽や動画配信では便利だと思うのですが、AI動画生成となると少し辛い状況です。Sunoですら月に触っているのが4~5日あるかないかで、ひどい時は1500クレジット以上を残して次の更新になってしまいます。動画生成サービスなんて、5000クレジットを未使用のまま更新になりクレジットが消滅した時はさすがに落胆しました。更新時に余ったポイントを持ち越せないというのがとにかくネックです。

今回からは、画像も動画もローカル環境、自分のPC内で完結できるようにしてみました。電気代はかかってしまいそうですが、余ったクレジット消費に追われることも、サブスクで支払いだらけになる事も回避できます。

ローカル動画生成:最新動画モデルWan2.2の導入

ローカル環境で動作可能な最新動画モデルWan2.2を導入しました。これらの導入は、一か月もたてばネット上の情報では古くなってしまい、記事の通りに導入してもエラー地獄に悩まされることも多々ありますが、こちらが最も導入が簡単でした。

EasyWan22(イージーワンニャンニャン)

https://github.com/Zuntan03/EasyWan22

導入方法は、ページ下部の制作者の説明を参考にしてください。私の環境(NVIDIA GeForce RTX 4070 Ti)では、10秒動画の生成に2~3分ほど。ただし解像度は480pです。サイズを上げるほど生成時間はかかりますが、アップスケールも可能です。

画像生成:Stable Diffusion(Forge版)

画像生成についても、こちらも高速で生成してくれるForge版を使っています。
https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file&_fsi=yEbxUBOb

導入方法は、ページ下部の制作者の説明を参考にしてください。AIに教えてもらうという手段もあるのですが、これも一か月もたてばバージョンが違いますから、エラー地獄へ放り込まれる可能性があります。最新のREADMEを確認しながら進めるのが確実です。

今後はSunoで作りこれは相当上手くいった!という曲に力を入れた動画を作りたいときに、Gensparkの方でVeoやKling、Hiluoを使っていこうかなと思っています。


物語に救いがなくなったリワインド・シティと、スケベなAIに困らされる。

リワインドシティ-

今回は制作に時間がかかってしまったので、記事も長めになりそうです (;´・ω・)(お金もけっこうかかっちゃった!)

リワインド・シティの秘話

この曲は、男性視点の「雪(Yuki/ユウキ)」の物語を、動画内ではヒロインの「紫苑(Shion)」が歌う、ちょっとややこしい構図になっています。 名前の意味は、男性の「雪」が“失われていく記憶”と“純粋さ”を象徴し、女性の「紫苑」は花言葉の“追憶”から、対になるイメージです。

曲の雰囲気とこの設定が固まった時点で、ふたりの思い出を描く“ほのぼのMV”からは、少し違う方向へ舵を切ることになりました。

サウンドとテーマ

表面上は歌詞・映像・メロディーでしっかりカッコよく振っていますが、内容は“過去の思い出”を歌うもの。恋人との出来事や、上京したてで田舎者丸出しでもいいじゃん!という空気感。その過去を巻き戻すように辿るので、タイトルは「リワインド・シティ」。ちなみに「アリス」は恋人が飼っていた犬の名前です。

サウンドの方向性としては、Cyberpunk 2077やエッジランナーズの「I Really Want to Stay at Your House」みたいなシンセポップを狙ったのですが、結果的にはJ-POPやシティポップの要素が強く出たかな、という感じがしています。

ミックスの試行錯誤

音をなんとか良くしたくて、REAPERでステム分離したトラックを一つ一つ調整しました。Sunoの原曲からの違いはハッキリ分かるくらいには仕上がっているものの、「本当に良くなったか?」は自分ではまだ判断しかねる感じです。ボーカルはコーラス以外をUdioでリミックスしたものに入れ替え。

今回はマスタリングをARIA(https://ariamastering.com/ja)にしてみました。
ARIAは、アナログ機材のチェーンを遠隔操作してマスタリングするタイプのサービスで、従来の“完全にデジタル内で完結”する自動マスタリングとはアプローチが異なるのが特徴。興味があったんです。
料金は1曲あたり1,537円(為替やプランで変動の可能性あり)。コストはかかるけど、キャラクターの立った音像と、耳当たりの良い高域のまとまりが得られたので、試してみてよかったです。
(※私のYouTubeはアーティストチャンネルではないので、容量もYouTube側で圧縮された状態で公開されるので、どこまでこの恩恵の音のまま公開できるかはわかりません。 汗)

ビジュアル制作の迷走と到達点

当初はかなりポップ路線で作るつもりだったので、初期アートと最終形はけっこう離れています。
初期のアート

(画像:初期のアート/扇風機の絵) 本当は左の扇風機の絵をメインで行きたかったのですが、YouTubeのアスペクト比16:9では、Stable Diffusionがこの絵のタッチのまま描いてくれない、という問題が発生し、描き込みがどんどん増える→方向性も少しずつ変化…という流れに。

(画像:紫苑の初期デザイン) その後、出来上がってきた曲の雰囲気から「実写寄りじゃないと合わないな」という結論になり、現在の紫苑が誕生しました。

(画像:スペース紫苑のコンセプト) 当初は宇宙船に乗っているのを紫苑側でやる案も考えていました。

過去の記憶にリワインドして、ほのぼの思い出を辿るだけでも良かったのですが、Geminiで遊びで作っていたSFシーンをどうしても入れたくなってしまい…結果、SF × シティポップ風という現在のテイストに着地。

こんな感じでちょいちょい遊んで作っていました。
こうして、SF × シティポップ風な動画になりました。

AIってホントはスケベでしょ!

AIって本音はそういう方向に走りがちじゃない?(笑)というより、学習データにそういうサンプルが多いのかもしれません。

困るのが動画生成。男女が至近距離に並んでいる画像を動画化しようとすると、こちらは一言も指示していないのに、すぐキスしようとする。今やフォルダの中身は“キス未遂のボツ動画”であふれています。
もしかすると他はそんな事はなく、たまたまGoogleのVeoがそうなの?Veoってスケベなの?

特に室内のシーンが厄介。寄り添う、みたいな指示を入れると勝手にやばいシーン扱いをされてポリシー違反で弾かれることがあるのに、キス未遂は勝手に量産。いったい何を想像されたんでしょう?(笑)

確かに歌詞に匂わせはあるけれど…でもね?
(それも本当は心の痛みの事を言っている。)

なんとか出来上がったのがこの動画。

まず、二人で布団をかぶって寝ろとは一言も指示していない。笑顔とも書いてない。
天下のVeo様生成なのに、紫苑の顔が崩れて若干西洋化してしまうほどの満面の笑み。このシーンだけ、二人でやたらうれしそう。

AIさん、おぬしも悪よのう(^O^)
曲中のシーンに採用してあげました。

Veoでガチ映像を作りたいときの、作り終わってから気が付いたこと

GoogleのFlow Proプランでクレジットは1000
なんと、Google Geminiのプロプランで使えるFlowのVeo2、Veo3なのですが、ultraプランにしないとウォーターマークが外せません!その代わり、Veo3-Fastなら現時点では消費クレジットが20。
Veo2でもqualityの方で生成すると消費が100クレジットなので、…結局どっちがいいの?とは疑問になってしまいますけど、要は早く作れる代わりに画質荒くなる可能性もあるよ!と言う事なのでしょうか?
とにかく、これがあったので今回、Flowの方で作ったシーンはウォーターマークが入っています。

そして、Genspark Plusプランでクレジット10000
クレジットがどれだけ消費されるかの明記がなく、動画の内容でも消費量が違ったりかなりの困りものですが、こちらで作るVeoにはウォーターマークが入りません。
ただし…うっかりVeo3で動画を作ってしまった日には一回で600~900ほどのクレジットが消し飛びます。

(おまけ)曲を作る際につくったプロンプトや設定の貼っておきます。

Suno スタイル

Atmospheric Synthwave, Cinematic, Melancholic, Lush synth pads, Pulsating synth bass, 80s electronic drums, Clean electric guitar, Dreamy female vocal, Medium tempo

Suno ネガティブ

Atmospheric Synthwave, Cinematic, Melancholic, Lush synth pads, 80s electronic drums, Dreamy female vocal, Medium tempo, no cheesy sounds, not pop, no robotic vocal

————————————

[Style: Atmospheric Synthwave, Cinematic, Melancholic, Lush synth pads, 80s electronic drums, Dreamy female vocal, Medium tempo]

[intro]
[ambient synth pads]

[whisper vocal]

[Chorus 1]

ゆらりゆらりゆらり
私は、私は
瞼の奥で記憶が踊る
Rewind rewind — take me back

[medium tempo 80s drums enter]
[pulsating synth bass]
時の粒子を溶かして飛んで
愛しい影よ 迎えに来たよ

[verse]
[clean electric guitar arpeggio]

[breathy female vocal]

[Verse 1]

静寂な悲しみを纏う君は
アリスという名の星を失くして泣いていた
僕にできることは羽根のように
甘えていいよ ここにいよう
ひそり のそり ほそり よそで
涙の名前をそっと数えて
朝露みたいなまつげが揺れて
吐息の色を一緒に見つめた

[bridge]
[building synth pads]

[crescendo]

[Bridge]

憧憬の街角空の切れ端
摩天楼の喉が風を吹いてる
上を向いて歩くしかなくて
鼓動のリズムが甘く響いて
野暮ったいと嗤われても
それが僕らの記号
訛りの渦を纏って All right

踊ろう
ネオンの泡立つ海に未来を重ねて
影絵の恋人 そっと揺れてた

[verse 2]
[tempo slightly drops]

[intimate vocal]

[Verse 2]

季節の螺旋を辿るうちに
強がりという名の仮面と
弱がりという名のベール
言葉の隙間に秘密が住んで
微笑みの端に霧がかかる
狭い宇宙で息を重ねて
未来の旋律を口ずさんだ
「痛いの?」って囁く夜更けに
Answer is silence — それでも stay

[chorus]
[powerful synth chords]
[emotional female vocal]

[epic drums]

[Chorus 2]

Drifting drifting yet
You are you are you are
瞳を凝らせば記憶の粒子が散らばる
Fast-forward rewind

魂は凍てつく 時の欠片を
溶かして着地 愛しい幻よ
終わりじゃないの
Goodbye is not the end

[outro]
[music box melody]
[synth pads fade out]

[whisper]

また、逢いに行く
記憶のオルゴール
そっと停止 Good night

————————————

https://note.com/nobinlog/n/n37bf1fe2c785
こちらの、「Stable Diffusionのillustrious系でオリジナルキャラを作る手順」を参考にさせていただきました。ありがとうございます!

キャラクター完全設定
基本情報
名前: シオン(Shion)
「紫苑」の花言葉「追憶」「君を忘れず」から。歌詞のテーマである記憶への旅と、アリスへの想いを象徴

年齢: 19歳
性別: 女性
種族・属性: 人間(記憶の旅人・感情の具現者)
職業・役割: 記憶と時間を繋ぐ案内人、感情の語り手

外見特徴
髪型・髪色:

セミロングの自然なウェーブヘア、腰近くまでの長さ
深いミッドナイトブルーから濃紺、毛先にかけて薄い藤色のグラデーション
前髪は軽やかで、サイドに自然に流れる
髪全体に星屑のような白い光の粒子が散在
瞳の色・形状:

大きなアーモンド型、透明感のあるアクアマリンブルー
水面や氷を思わせる澄んだ色合い
やや伏し目がちで、奥に深い思慮と意志を宿す
光の加減で瞳の中に微かな輝きが見える
服装・装飾品:

淡いアクアブルーのロングワンピース
シフォン素材で透け感があり、オフショルダー気味のデザイン
装飾は一切なく、シンプルなシルエット
水彩画のような色の滲みが特徴的なテクスチャ
身長・体型:

身長:155-160cm程度、やや小柄
華奢で繊細な体型、肩幅が狭く女性らしいシルエット
特徴的なポイント:

微かに開いた口元と頬の薄いピンクの色彩
物憂げでありながら遠くを見つめるような表情
髪と服に付着する記憶の粒子(光のエフェクト)
性格・性質
性格: 内向的で感受性豊か、メランコリックだが芯は強い
話し方・口調: 静かで丁寧、詩的で抽象的な表現を好む
趣味・好きなもの: 夜空の観察、古い記憶の収集、アンビエント音楽
苦手なもの・弱点: 騒音、強い光、感情の激しい衝突
価値観・行動原理: 記憶は現在と未来を繋ぐ大切なもの、失われたものにも意味がある

背景設定
生い立ち: 幼い頃に愛犬アリスを失い、その喪失感から記憶が視覚化される能力を得た
現在の目的・目標: 失われた記憶と愛を繋ぎ直し、その意味を理解すること
特別な能力・スキル: 記憶の視覚化、感情の共鳴、時間感覚の操作
人間関係: アリス(失われた愛犬)、「僕」(歌詞の語り手)、故郷の家族
(この辺は動画では不採用 ユウキの方へ)

シオン登場させるときの専用 プロンプト

————————————

This hyper-realistic film photograph depicts a realistic image of Shion, a petite 19-year-old Japanese woman. She has long, wavy hair with bangs that reaches her chest. Her hair is a deep midnight blue to lavender gradient with natural highlights. Her large, almond-shaped aquamarine blue eyes are visible. She is wearing a light aqua blue casual dress. Even the texture of her skin is meticulously rendered, with meticulous attention to detail. 35mm film, 50mm lens, masterpiece quality. High detail, nostalgic 80s aesthetic.

————————————

このハイパーリアリスティックなフィルム写真は、小柄な19歳の日本人女性、紫苑の写実的なイメージ。彼女は、前髪のあるロングのウェーブヘアに、胸まで届く髪。深いミッドナイトブルーからラベンダーのグラデーションに自然なハイライトを入れています。アーモンド型の大きなアクアマリンブルーの瞳が映っています。彼女は淡いアクアブルーのカジュアルなドレスを着ています。肌の質感までもが精緻に描写され、細部まで丁寧に描き込まれている。35mmフィルム、50mmレンズ、傑作級のクオリティ。高いディテール、ノスタルジックな80年代の美学。

————————————

男性キャラクターの基本設定

男性を「ユウキ(Yuki)」と名付けます。「雪」の意味から、失われた記憶の冷たさと純粋さを象徴し、シオンの「紫苑」(追憶)と対になるイメージです。

年齢: 20歳(シオンより少し年上、保護的な役割を強調)。
性別: 男性。
種族・属性: 人間(記憶の共有者、感情の守護者)。
職業・役割: シオンの伴侶的な存在として、記憶の旅を支える語り手。曲の「僕」の視点から、アリスを失った喪失を共有。
口調: 落ち着いた低音で、簡潔だが優しい。詩的な表現を交え、シオンと調和。
趣味・好きなもの: 夜の散策、古いレコードの収集、静かなギター演奏。
苦手なもの・弱点: 孤独の再確認、騒々しい環境、過去のトラウマの露呈。
価値観・行動原理: 失われたものを取り戻すために、現在を大切に生きる。シオンと共に記憶を繋ぐ。
生い立ち: 愛犬アリスを失ったシオンと出会い、2年後には宇宙進出時代へ。軍人となる。
人間関係: シオン(パートナー)、故郷の家族。
外見のイメージ: hyde風に、小柄で細身の体型、長い黒髪、鋭く優しい目つき。クールでロックな服装(例: 黒いジャケットやシャツ)。実写で現実的に描写し、アニメ風にならないよう注意。

————————————

ユウキを登場させるときの専用プロンプト

This hyper-realistic film photograph depicts a realistic image of Yuki, a slim 20-year-old Japanese man inspired by the style of L’Arc-en-Ciel’s hyde. He has medium-length straight black hair that falls to his shoulders with subtle waves, sharp yet gentle almond-shaped dark brown eyes, and a cool, introspective expression. He is wearing a fitted black leather jacket over a simple white shirt, paired with dark jeans. His build is petite and athletic, with fair skin texture meticulously rendered in high detail. 35mm film, 50mm lens, masterpiece quality. High detail, nostalgic 80s aesthetic.

宇宙服姿ユウキ

This hyper-realistic film photograph depicts a realistic image of Yuki, a slim 20-year-old Japanese man inspired by the style of L’Arc-en-Ciel’s hyde. He has medium-length straight black hair that falls to his shoulders with subtle waves, sharp yet gentle almond-shaped dark brown eyes, and a cool, introspective expression. He is wearing a sleek, form-fitting black spacesuit with subtle metallic silver accents on the shoulders and chest, integrated life-support patches on the arms, lightweight boots, and a removable transparent helmet held under his arm or attached to his belt. The suit has a nostalgic 80s sci-fi aesthetic with streamlined panels and faint glowing seams for functionality, emphasizing his petite and athletic build. His fair skin texture is meticulously rendered in high detail. 35mm film, 50mm lens, masterpiece quality. High detail, nostalgic 80s aesthetic.

さりげなく、ラルクのハイドっぽくしろって指示を混ぜてあるので、たまに超ビジュアルバンド顔になる。AI様のご機嫌次第。


個人ブログ運営の落とし穴、検索流入を失ったMEVIUSのデジタルアトリエ復活への道のり

webサイトの失敗

話題がガラリと変わってしまいますが、ここのホームページ(ほぼBlogですが)について。当初、ほとんど8〜9年ぶりに一切触っていなかった知識を思い出しつつ、サイトをコーディングから構築したわけですが、最初はよかった。

期待に胸を膨らませた初期の好調ぶり

作ってほぼ何も書いていないのに、一日100近い流入があり、「今ってこんなに最初から来るんだ!」と驚いたものです。さらにはAI(Perplexity)にLLMのことを聞くと、このサイトの初期のページが引用されたりして好調だったのですが、ある時タグの書き方を間違えていることに気がついたのです。
※Web業界でもブロガーの間でも、当時からタグの扱いは注意があった、そんな記憶がうっすらと…。
タグを一気に修正してしまったのです。

実際、新規サイトでも適切な設定を行えば、公開初日から一定の流入を得ることは可能です。Google Search Consoleのデータによると、正しく構造化されたサイトは公開から1日〜数週間でインデックス登録が完了し、検索結果に表示され始めます。

技術的な落とし穴、見落とした重要な設定

この辺り、運営ではなく作る側に注力していたがために抜け落ちていた大事なこと、そうGoogleのクローラーです。タグを一気に修正したために、Googleにインデックスされた情報と同じページがあるよと多重ページ扱いになり、さらには当時のHPのタイトルは「mevius.net」。

紛らわしいことにドメインは「mevius.blog」そしてタイトルは「mevius.net」。しかし、怪しい海外のサイトで「mevius.net」のドメインのHPがあり、ここを作った当初はそんなページはなかったような…そこにはなんだか恐ろしいことが書いてあったのですね(汗

そこでサイト名を変更したわけですが、検索にここが出なくなってしまいました!

典型的なSEOペナルティの症状

記事タイトルでも出なくなったので、ペナルティでも入ったのかと思いきや、入れていたプラグインでタグに対してnoindexにしていたはずが、Google Search Consoleではサイト自体がnoindexになっていると出たりして、踏んだり蹴ったり。今に至ります。

これは2025年現在でも頻繁に報告される問題で、特にWordPressサイトでプラグインの設定ミスにより、意図せずサイト全体にnoindexが適用されてしまうケースが多発しています。

必死の復旧作戦、やるべきことはやった

現在ではすべて対処し、サーバーのデータベースで直接タグ情報を削除し、プラグインのキャッシュを削除し、htaccess、robots.txtへの記載、尽くせる手は尽くしたのですが、まだ出てこないようです。

実際の復旧作業として以下の手順を実行

技術的修正項目

  1. noindexタグの完全除去 – データベース直接操作
  2. プラグインキャッシュのクリア – 設定干渉の排除
  3. htaccessファイルの最適化 – クローラビリティ改善
  4. robots.txtの適正化 – 検索エンジンアクセス許可
  5. URL正規化 – 重複コンテンツ問題の解決
  6. サイトマップ – クローラーにHP内を巡回してもらいやすく

これらの対策は、2025年最新のSEO復旧手順として推奨されている標準的な方法です。

復活への期待と現実

あとは待つのみ…ですが。。
商用目的でもない個人的な運用で、別に検索トップに出なくてもいいとはいえ、流入がXのみだと、さすがに記事を書いていて虚しいです(笑)

ついでなので下記に調べて得た情報をまとめておきます。(協力 → Genspark)

実際の復旧期間について

最新の調査データによると、SEO設定を修正した場合の復活期間は4ヶ月から1年程度というのが一般的です。Google公式の見解では、手動ペナルティの場合約1週間、アルゴリズムによる自動ペナルティの場合は数ヶ月かかるとされています。

2025年のSEO環境の変化

実は、2024年から2025年にかけて、個人ブログにとって追い風となる変化も起きています

X(Twitter)からの流入の価値と限界

現在の状況では、X(Twitter)からの流入が主要な読者獲得手段となっています。実際、SNSからの直接流入は検索エンジンからの評価にも間接的に影響します。

SNS活用の戦略的意義

  • サイテーション効果:SNSでの言及が検索エンジンの信頼度評価に影響
  • 被リンク獲得機会:SNSでの拡散が外部リンク獲得につながる可能性
  • ユーザーエンゲージメント:直接的な読者とのつながりによる品質向上

SEO専門家の分析によると、SEOとSNSの連携により、検索流入を獲得した記事のSNS拡散が、さらなる被リンクやサイテーション獲得につながる好循環が生まれるとされています。

今後の展望:復活への具体的戦略

短期的対策(1-3ヶ月)

  1. Search Consoleでの定期的な再インデックス申請
  2. 新規コンテンツの継続的投稿
  3. X(Twitter)での積極的な情報発信継続

中長期的戦略(6-12ヶ月)

  1. キーワード戦略の見直し2025年版個人ブログSEOに基づく最適化
  2. コンテンツ品質の向上:独自性と専門性を重視した記事作成
  3. 技術的SEOの継続改善:サイト構造とページ速度の最適化

まとめ:個人ブログ運営者への教訓

この経験から学んだことは、技術的な知識と運営ノウハウは別物だということです。8-9年のブランクがある中で、SEOの世界は大きく変化しており、特に以下の点が重要だと痛感しました

  • 設定変更は慎重に段階的に実行する
  • Search Consoleでの定期的な監視が不可欠
  • 復旧には相当な時間が必要なことを覚悟する
  • SNS流入も立派な読者獲得手段として活用する

商用目的でない個人ブログでも、せっかく書いた記事が多くの人に読まれることは、書き手にとって大きなモチベーションになります。現在はX流入のみでも、継続的な改善と時間の経過により、必ず検索流入は回復すると信じて、コンテンツ作成を続けていく所存です。

参考資料:


HABATAKE – Remasterをアップロードしました!本当によく聴く好きなジャンルとは逆をやる。

はばたけサムネ

8月1日より「AI音楽生成アーティスト」のyoutubeチャンネルでのプレイリスト作成と配信を開始、というXのコミュニティでありがたい企画があり、参加用にHABATAKEをRemasterしました。

HABATAKE Remasterについて

ド正直に言います。
この曲は、自分の音楽の好みで言うと実は対極の音楽性で、それをあえて作るという挑戦として制作した結果、何かすごくうまくいってしまった一曲です。(でも、相対性理論(アーティスト)は好きなのでそれは意識しています)
旧HABATAKEの方ではアコースティックギターの音が入らず、そのまま公開したのですが、今回は気に入った方にボツになった方の曲だけギター音が入っていたので、ステム分離でギターパートだけを抽出して合体させています。

歌詞もとても前向きで、このチャンネルでは奇跡に近く、以降このテイストで行こうとしても、すぐにロックやメタルっぽさが出てしまったり、ネガティブ寄りになったりして、なかなか難しいです(笑)
確か、この詩を書いていた時はXでいろんな人の曲を聴いて回っていて、とっても刺さったチャンネルがあったのですよね。そこからやる気と元気をもらいました。

イラストも、小学校の国語の教科書の挿絵や絵本などの水彩画が好きで、そういったテイストにしました。あまり採用されているのを見かけませんし、とても曲に合っていると思っています。
自分の過去の絵や参考になる絵を参照させ、Geminiにスタイルを再現できるプロンプトを出してもらったわけですが、この絵柄は一文変えただけで別物になり非常に維持が難しかったです。(学習させてるわけじゃないですよ。)

一つの単語が違うだけで、大きく変わってしまう出力

6月ごろから新作のアップロードを、以前の2週に1本ペースから週1ペースに上げたため、なかなか他の生成サービスや情報を追いかけられなくなってしまっているのですが、Xを見る限りハイクオリティな動画を多く見かけるので、自分がまだ触っていない画像生成サービスに触れてみたいなと思うこの頃です。

映像も好きなので、欲張りですがどっちもいいものが作りたいです。


「Shot Navy Blue – 夢ドライブ」うちのチャンネルで一番JPOPらしい曲

Shot Navy Blue

出だしは「ツン!」ではなく「Ten」と言っています。

ten…、twenty…、Thirty…、
forty…!

数字の連呼から始まるこの曲は、まるでアクセルを踏み込み、一気にスピードを上げていく表現から始まります。
とはいえSunoにその事がわかるはずもなく、謎のエコーがかった囁きのオープニング。
キャラクターが指で「ツン」とするシーンからドライブが開始し… しかし!

今回はアートをどうしようかと初期段階から迷走気味に。

この動画を、HABATAKEの頃のように絵本や童話のような世界観で表現したいと考えていました。しかし、虹の美しい景色を車で駆け抜けるスピーディーな描写と、絵本風のキャラクターを両立させるのは想像以上に難しく、試行錯誤の結果、現在の映像のような形に落ち着きました。(もちろん、より洗練されたプロンプトや他の生成サービスを試せば、また違った結果になったかもしれません。)

そんな中で、画像も動画も過去最大の生成数となり、実際に使用できたのは全体の約3分の2ほど。抽象的な、キャラクターがただそこにいてエフェクトがあるだけのMVからはそろそろ卒業したいと常々思っているのですが、まとまった時間が取れないと、なかなか難しいのが現状です。

動画も失敗作がたんまりとあります!

制作過程ではたくさんの失敗作も生まれました。特に印象的だったのは、GensparkのMixture-of-Agents機能で画像から動画を生成しようとした際のこと。画像を入れ忘れた上にVeo3が使われてしまい、クレジットもろとも大爆死…という、Xでもご紹介した動画が爆誕してしまいました。

出来は良く、歌までついているのに、使い道がないというもったいない動画が生まれてしまったわけです。車で走るシーンは、失敗作でなくとも絵柄の統一感を出すのが難しかったのですが、登場人物のキャラクターを「思い描く夢の姿」と捉えていただけたら幸いです。どちらも夢のような描写ではありますけれどね(笑)

映像部分はまさに「踏んだり蹴ったり」でしたが、曲自体は中盤が特に良くできていると思っていて歌詞とメロディーがぴったりとマッチし、曲の魅力が引き出されたと思います。
ぜひ最後まで聴いてもらえたらうれしいです。

おまけ (実は2回やらかしている。)


歌詞提供で制作した「フェイルチェイン(FAIL CHAIN)」

フェイルチェイン-サムネイル

今作は、ゴシックなエレクトロやインダストリアル・シンセポップの影響を取り入れつつ、ダークな雰囲気のボーカロイド・ポップです。

ボカロで楽曲制作をしていた知人から歌詞の提供を受けて、今回の曲を作ることになりました。はじめは別の方に「歌詞を作ってみない?」と声をかけ、「作るりたい!」と快諾をもらっていたのですが、そのやりとりを見ていた知人が、先に歌詞を仕上げて提供してくれるという展開になりました。ダークなボカロ風に、というリクエストだったのですが、私自身はあまりボカロを聴く方ではないので、最終的にはSunoらしいノーマルな曲調に仕上がりになりました。_(._.)_
最初はボーカルは初音ミク的な機械音で作って、後で変更したのですが、サビの方で荒いというか少し名残が残ってしまっています。

本来お願いしていた方は、「全力で乙女の恋愛曲を書くよ!」と言っていたので、『HABATAKE~夏色パラドックス~』に続く、明るい雰囲気の曲になる予定でしたが、先に頂いたフェイルチェインの制作を開始し、今作が先という形に。 また曲のジャンルも変わったので、久しぶりに実写系の動画で制作。

個人的な感想ですが、実写の動画生成はアニメよりも作りやすいと感じています。しかし、未だに動画生成の方は元の画像を日本人の顔に設定しても、大きく動くシーンになると、海外の方の顔になってしまいますね。
ちなみに未来的描写で実写シーン作るのが好きです。

そんなこんなですが、普段の自分では絶対に使わないような歌詞の言い回しも多く、新鮮な気持ちで制作することができました!

次回からまたゆるふわ系の曲に戻ります。
予定ではあと4曲!


本当はこわ~いかもしれない、「アリスシンドローム」夏のホラーで表現したかった。

アリスシンドローム

不思議の国のアリス症候群って?

幼少期に経験しやすいそうです。

医者ではないので詳細は知りませんが、私は小学校時代に38度以上の高熱を出したときに夜寝ていると、歌詞の通りの現象が起きます。不思議な体験ができて楽しい!なんてことは微塵もなくて、幻覚が怖いわけでもなく、ただただ恐ろしい恐怖を感じるのです。

脳が死と向き合っているような、全力でそれを拒もうと足掻いているみたいな、でも何が怖いのか全く分からない状態。小学生では、その尋常じゃない恐怖に耐えられないので親のところに駆け込んでいくしかない。それでも収まりはしないので、無理やり寝ることでしか対処法がありませんでした。

朝に収まると、あれは何だったんだ?と、いつも通りに戻ります。

当時は原因不明。ドーナツみたいなものに入るCT検査も受けました。お手上げという感じでして、「不思議の国のアリス症候群」という言葉を初めて聞いたのは成人を過ぎてからでした。

あんまりホラーじゃないPOP要素とメタル要素の融合

不思議の国のアリス症候群=アリス症候群の体験を、夏のホラーっぽい曲に再現したかったのですが、歌詞が症状に忠実なので動画もホラー要素を抜いて「アリス要素」高めになりました。

演奏も、Sunoにその時の心境を頑張って音にしてもらって、サビ部分からはヘヴィーなサウンドに変化します。本当はBPMも上げたかったですが、ジャンルが違いすぎてしまうとインプレッションがもらえない、チャンネルが壊れる、というやつになるらしいので控えめに…。(YouTubeってめんどくさい。)

Extendでセクションごとに作っていくと間奏が入りやすく、この曲は3か所も間奏が入ってしまい5分の長尺に。エンディングは違う詞で締めくくるはずだったのですが、SunoのAI的にはブリッジの「抜け出せない 夏の幻」を歌い終えた時点で、この曲ここで終わりでしょ?という感じに、Extendを受け付けなくなってしまいました。

短い詩なら入れてくれたので、ラストがこれはもう蛇足じゃない?みたいな仕上がりに。うーん無念です。

映像はAnimonのサブスク終了前日だったので、画像、動画ともほぼフルでAnimonで作っています。最近は利用者が多いらしく、生成に時間がかかりますが、朝方はさすがに生成が早いです。オープニングだけ、Veo3とその動画の延長にHailuoを使いました。

現在Gensparkという検索型AIサービスを利用しているのですが、そのサービス内で各社の動画生成もクレジット消費で生成できるので、「あとでここだけ追加」、などの時にとても便利です。

余談

オープニングのアリスのいる杉林、歌詞の「cedar tree」、あれは実家の周りの杉の木のことで、実家と言えば杉林というほど印象に残っていました。


これまでよりだいぶ振り切って作った「夏色パラドックス」さりげなく制作一周年の曲。

夏色パラドクス

思いっきり夏と恋愛がテーマのトロピカルな曲。

聴いて楽しい曲を目指して

今回は「聴いて楽しく」をテーマに、キャッチーで親しみやすい楽曲作りを心がけようと思い、サビでは、同じフレーズを繰り返すことで耳に残りやすい構成を意識しています。一度聴いたら頭から離れない、そんな中毒性のある曲が作りたい!

歌詞はこれまでになかった方向で、思い切り振り切って作りました。
さらに、これまで恋愛を歌った曲は「18&19」という曲しかなかったので、これが二作目になります。
※過去作の「水の頁」と「Distance」は恋愛を想起させるかもしれませんが、実際には異なるテーマを扱っています。

映像制作のほうでは

前作同様にフレーズごとにシーンを順番にっていくやり方を継続しています。ただし今回は、一つの連続したストーリーではなく、「潮のひみつ」= セレヌスに出てくるような架空の生き物たちが、夏の海を楽しむ人々の知らないところで密かに何かを楽しんでいる。という演出になっています。動画に特定の主人公はいません。

映像は、Animon生成の低解像度の制約を補うために、動画の中のさらにモニターの中の映像、という方法で小さく表示することで解像度の粗さを減らしています。

今回、Sunoのさわやかな演奏がお気に入りで、ベースのメロディーラインがとてもお気に入り。
低音がよく聞こえる環境で聴いてほしいです。
ついでに、タイトルで触れている通り、初めてSunoを利用し始めて丁度一周年目の曲となりました。

最初に浮かべた世界観のイメージ画


制作の過程を変えた新作「水の頁」作風変更から4作目を公開!一枚絵から誕生。

水の頁

7月1日に新曲「水の頁」をアップ

これまでの制作フローと、見えない壁

今回は作風ではなく、制作方法そのものをこれまでのやり方から大きく変えて制作してみました。

これまでは、まず歌詞を書いてSunoで曲にし、歌詞をいじったりスタイルを変えたりしつつ、気に入ったものをUdioでリミックスし、ボーカルを入れ替え、演奏自体はReaperで混ぜたりいじったりしていました。(Synthesizer Vは初期の頃から一切使わなくなってしまいました。)

その段階で、画像を大量に用意していきます。動画にするのも、シーンは後で編集するつもりで適当に生成しておきます。しかし、作業は平日は仕事に追われる身(いわゆる社畜)、とぎれとぎれになってしまいます。そうしているうちに、絵柄も変わったり、「やっぱりこっちにしよう!」と、シーンを変えたり生成サービス自体を変えたりで、いつもまとまりがありませんでした。どうしてもこれを何とかしたかった。

「一枚の絵」からすべてを始める

いつも歌詞の書き始めでものすごく時間がかかる。そこで今回は、まず頭の中でまだ靄っとしているテーマから情景を想像し、それをそのまま画像生成のプロンプトに入力。出来上がった一枚絵イラストを参考に一気に歌詞を書くやり方に変更しました。歌詞が浮かばない時はまずそのイラストの風景を文字にしていく。作文だって最初の数行を書きはじめてしまえば、ペンが進む!のブーストバージョンです。言い回しがどうしても浮かばなかったら、AIに流してしまって比喩表現の案を出してもらうのが手っ取り早いですが、多用すると自分で作った感がなくなりますし、丸投げするともう他人の作った曲と変わらないので最後の手段です。

そこからの曲完成までの過程は変わらないのですが、動画の作り方も変更しました。あらかじめ画像を作っておくというやり方をやめ、曲に合わせて1シーンずつ画像生成→動画生成、また次のフレーズで画像生成→動画生成で連続して作っていくやり方に変更しました。

映像を曲に合わせる

当初、YouTubeは自分の曲を公開できる場として利用し始めたに過ぎず、初期の動画はあくまで静止画よりはいいくらいの「おまけ」程度の意識でした。プロのアーティストだって、歌と直接関係ないイメージ映像をMVに使うし、と細部にあまりこだわらず。

しかし、今回の新しい制作フローを試した結果、出来上がった作品はかなり曲をわかりやすくしてくれました。音と映像が互いに意味を補い合ってくれる。フレーズに沿って作ったシーンは、曲の解像度を上げて、雰囲気にも合う仕上がりになったのではないでしょうか。
今後は生成結果にも妥協せず、完成度を高めて行けるように自身のスキルアップと、目を肥やすことにも注力していきたいです。

というわけで!是非「水の頁」耳と目を傾けていただけたら嬉しいです。

原案の画像です。


未定義エラーと虹色の座標という曲は超抽象表現、コンピューター用語で幼いころを歌う。

未定義エラーと虹色の座標

metalのように強く歪ませた重厚なギターのベースも重なった鋼のような音、そこにリズムを刻むバシ!バシと高速で叩き込まれるドラムの音も好きですが、ゆるふわで独自の世界観、そこに中毒性の高い反復、リフレインを効かせた曲も好きです。

HABATAKE、セレヌス、に続く第三弾

未定義エラーと虹色の座標

もっと明るい曲を作ろうとした割には、歌詞の題材がノスタルジックな内容。
そこで歌詞をかなり変更して、意味はそのままとにかく明るくしたい!
そうこうして今の形になりました。

初期

[Chorus]
Ah 夏休みが終わって
いつか大人になるのは
とても心配で
I want to think differently
I want to think differently

[Chorus]
ああ、夏休みの終わりが虹になる
いつか大人になるのは
すこしこわいけど
くるくる、くるくる 考えたい
くるくる、くるくる 考えたい

[Chorus] 最終修正
ああ 夏休みの終わりが虹になる
いつか大人になるのは
とても心配な演算処理
思考回路を再設計したい
思考回路を再設計したい
キラキラの明日をインストール
キラキラの明日をインストール

英語に頼らず超抽象、反復、リフレイン強化で今の形に。
とはいえ、今まで書いた詩なんてまだ50いかないし国語が出来るわけでも頭がいいわけでもない。
比喩表現の案は、最近パワーアップしたGeminiと、ChatGTP&Claudの案をまとめてくれるGensparkのリライトで出してもらいました。

  • 「夢の続きをインストール」(希望と不安の反復)
  • 「思考回路を再設計したい」(成長への願望)
  • 「キラキラの明日を」(未来への憧れ)

こんな感じです。

演奏のプロンプト

今回はHABATAKEのペルソナに、新たに2000年代初頭のインディーロックのバイブ明るいエレキギターのアルペジオ、メロディアスなベースるいエレキギターのアルペジオ、メロディアスなベースをプラスしています。
ヴォーカルは「ファルセットブレイク」「フレーズエンディングのボーカル反転」「ボイスクラック」「レジスターブレイク」、要するに、語尾で声を裏返らせろ!って注文を付けてるのですが、多すぎたのかほぼ無視されました。そもそもSunoのペルソナを使ってますしね。。

Clap Your Hands Say Yeahというアーティスト

以前このようなポストをしまして、実際に寄せて作ったバージョンもあります。
このアーティストは、ボーカルがとにかく脱力系、裏声連発。
ヴォーカルの指示も、どれにしたら再現できるのかわかりませんが、
「ファルセットブレイク」「フレーズエンディングのボーカル反転」「ボイスクラック」「レジスターブレイク」「ヨーデル風ボーカル反転」「エモーショナルなボーカルブレイク」「ファルセットトランジション」もう指定しまくり。結果うまくいきませんでしたが、演奏のみ「っぽい」感じになりました。
これはこれで研究したら楽しそうです。

久しぶりのYouTubeショート動画!のつもりが、久しぶりすぎて3分以内じゃないとダメと言う事を忘れてました。


アヴァロンやガンダーラ、桃源郷みたいな。歌の中の創作の楽園「セレヌスの国」

セレヌス

あと8曲ほどこっち系の路線でいく予定です。

創作の国 セレヌス

セレヌスは、前作HABATAKEに続く曲として制作しようと思いましたが、テーマが何も浮かんでこず。
そんな時に、「創作って夜に捗る」「静かで集中しやすい」「インスピレーションが高まる」なんて話を思い出して、その環境の理想郷として歌にしました。

当初「穏やかな」「澄んだ」「静かな」という意味を持つ「セレニア」がタイトルでしたが、ネットで検索すると犬や猫用の制吐剤「セレニア」が大々的に出てきてしまうので、似ている意味を持ちながら音楽的なニュアンスも含む「セレヌス」にしました。

ふわふわっとした雰囲気を前作から引き継ぎつつ、童話的な雰囲気を盛り込んでいます。

動画生成はAnimon

今回の動画生成は、全編Animon AIを使っています。
課金するとウォーターマークを消せて、二つ同時生成が可能になります。
無料プランとあまり変わりませんが、生成にクレジットの縛りがないことが魅力で、破綻した失敗動画を誤魔化しつつやむなく使用する、という妥協をせずに済みます。
そのおかげで、一番完成度の高い映像になっているのではないでしょうか。

ただし、当初ImageFXで画像を用意していたので、絵柄が若干違うシーンがあります。
画像自体もすべてAnimonで作った方が、日本人受けする絵柄で可愛いなと思います。

DAWでボツテイクを合体

さらに今回、せっかくDAWを使って仕上げるのだからと、ボーカル部分、演奏部分で不採用になった曲の中から、お気に入りの部分だけを切り取ってつなぎ合わせています。
「ワン、ツー、スリー!」の声もそうだったりします。
最近ここまでいじる事もしなくなっていたので、原点回帰です。
聴いていても気づかないレベルで合体させられたのではないでしょうか。
要所要所で、SunoではなくUdioの音源を合体させたりもしています。


オルタナティヴ・ポップやシンセポップを意識した、作風をガラっと変えた「HABATAKE」

HABATAKE

HABATAKE / はばたけ

歌詞は「成長と希望」ジャンルは、なんだろ?

Sunoで作り、Udioでリミックスした音になっています。
音としては、どのジャンル名にするのが一番正しいのかわかりません。メタルばかり聴いていた弊害で、その他のジャンルの名称の知識に乏しいのです…。
GoogleのAI、Geminiに聴いてみたら「これはサイケデリックトランスです!またはゴアトランス、ハードコアです。」と言うし、そんなバカな!
この曲は相対性理論、やくしまるえつこを意識しています。ギターのアルペジオをバリバリに入れてほしかったのですが、出来上がってみたらギター音が一つも入っていません(笑)
そのかわりに、ヴォーカルがソロの曲の時に似ています。

「HABATAKE」は月曜日の朝に聴いてほしい一曲になっています。
私の書く歌詞には「時間」という言葉が頻繁に登場するのですが、日々時間に追われているからでしょうか。その単語を使うのが癖になってしまっています。
平日、早く終われ!休日、終わるのが速いよ…。

歌詞は、自分のありがちな日を書いているうちに自然と「希望と成長」を語っているものになっていました。

映像制作について:AI動画生成ツール「Animon」

映像は今回、2025年、4月にサービスを開始した、熊本に拠点を置く企業が開発した「Animon」を使いました。
ずっとなのかはわかりませんが、個人ユーザーは無料プランで、ウォーターマーク入りで回数無制限で動画を生成できます。
プロンプトは日本語にも対応していますが、英語で入力する方がより高精度な結果を得やすいとのこと。今回は、まずシンプルな日本語の指示で試してみました。

動画の途中でキャラクターの動きが一部不自然になる箇所もありますが、細かい指示が可能。
これはプロンプトや元画像の工夫次第で、さらに完成度を高められる可能性を感じます。