info@mevius.blog

Archive 記事一覧

Flicker of Dawn-【夜明けの揺らぎ】燼-【ZIN】Same Tomorrow-【同じ明日が来て】3曲紹介

年始はゆっくり過ごせたものの、気づけば以前より忙しくなり、更新が遅れてしまいました。休みの日は曲作りと動画制作に没頭していて、あっという間に時間が過ぎていきます。
というわけでまとめて紹介していきます!

最初の紹介はFlicker of Dawn夜明けの揺らぎ)です

初期の頃は、感じたままに曲を制作していましたが、今作は「歌詞」に力を入れています。最近では意味が分かりやすく、心に響くような歌詞を書こうと意識しているのですが、まだまだ未熟です。
特に、Sunoの場合、音楽に合わせてフレーズを乗せるような作り方ではないため、いざメロディーに私の歌詞を乗せてみると、どうしても素人っぽさが目立ってしまうように感じます。
そこで今作では歌詞をとことん物語性、対比的な表現、サビのフレーズ、実際にメロディーに乗った時におかしくならない言葉選び、を心がけたつもりです。
テーマは「自己との対話」です。

映像については、AI生成特有の違和感のある仕上がりの画像をすべて削除し、生成の際にはプロンプトをOpenAI o1に修正してもらいました。動画制作には、前作でも使用したKLING AIが非常に高性能だったため、今回もKLING AIを使用しています。

使ってみて改めて実感しましたが、OpenAI o1は本当に素晴らしいです。「こういう感じの絵を描きたい!」という漠然としたイメージを、見事に昇華してくれました。ただし、o1は利用制限が厳しく、毎回使えないのが難点です。

次に紹介するのは燼 -(ZIN) リメイクです

定期的にぶっこむメタルです。
今回リメイクしたのは、最初にアップロードした旧バージョンの動画の出来栄えがあまりにも悪く、さらに、曲の方も歌い間違いが多く、納得のいかない出来だったからです。そこで、素材を再利用し、新たに作り直しました。旧バージョンはこの動画の概要欄から見に行けます。

「Flicker of Dawn」とは打って変わって、非常に激しく、力強い楽曲に仕上がっています。 歌詞は、見ての通りストレートで風刺的な内容ですが、いざSunoに歌わせるとフレーズがダサく感じてしまうのが悩みです。 画像に関しても、女性を描くのは上手いのに、男性を描かせると途端に絵柄に違和感が出てしまうのは、AI画像生成の弱点だと感じています。主人公なんて、「〇だけ〇ベルアップな件」のキャラクターかな?って思ってしまったり。

少年向けのバトル風作品は不慣れで、未熟さが出てしまった映像ではありますが、リメイク版の演奏は個人的にとても気に入っています。特にドラムの重低音が好きな方は、イコライザーで低音を強調して聴いてみてください。

テーマは「抵抗と革命」、「覚醒と団結」、「自由と解放」です。
現実では某TV局の報道ばかりで、それどころではないようです。

最後は新作Same Tomorrow(同じ明日がきて)です

日常性とノスタルジー、軽やかさと希望…このチャンネルでは、こういった雰囲気の曲が多いのですが、今回はとあるアーティストの雰囲気に寄せて作ってみました。すると、出来上がった曲の声がそのアーティストにそっくりになってしまい、驚いた作品です。動画に使用したのは、少しだけアレンジを加えたバージョンです。

・「そっくり」というか、ほとんど「本人」です。さすがにまずいですよね。
(初期バージョン 音量注意)

ちなみに、出だしの「やんちゃなあいつのバイクの後ろ」というフレーズ、バラードで聴かせるのは違和感があるのですが、サビの部分があまりにも素晴らしかったので、そのまま採用しました。

↓このテンポで歌ってくれた場合は、違和感がないと思うのですが仕方ありません。(音量注意)
こちらを採用でもよかったのですが、前者のサビの部分の神曲ぶりが…

映像は、初期の構想ではフラクタルなアートを使用し、AIアートを前面に押し出した動画にする予定でした。しかし、途中で「これは本を読んでいる登場人物の作品にしよう!」というアイデアが浮かび、実写シーンを追加することにしました。三部作の時の白い髪の女性の実写版が爆誕です。

その実写シーンを現代風でありながら異世界のような雰囲気にしたいと考えましたが、ふと思い切って未来的な世界観にしてみよう!と思い、今の形になりました。 結果的に、曲の始まりの「やんちゃなあいつのバイクの後ろ、明日の買い物」というフレーズが、さらに違和感を感じるようになってしまいましたが…。
「Flicker of Dawn」では気を付けていましたが、今作ではちょっとおかしな画像があります。(本の文字とか)
個人的には気に入っているのですが、視聴維持率が圧倒的に悪く、タイトルのあるAIアートを動画にさほど載せられていないので、期待した人をがっかりさせているかもしれません。
あとやはり曲の出だしでしょうか。

テーマは「個性と調和」です。

チャンネルはこちら
www.youtube.com/@meviabsolute9179
🔔いいねやフォローしてもらえたらすごくうれしいです!


「AWAKENING – Beyond the Silence」と、便利な動画生成AI、制作に役立つ検索AI

AI音楽 AWAKENING

数年ぶりの年末年始の休暇を活用して、創作活動に没頭する貴重な時間を過ごしました。

今年最初の曲と動画制作は迷走からのスタート

きっかけは、10月から遊んでいるゲーム「メタファー:リファンタジオ」です。今や『FF』や『ドラクエ』に続く国民的RPGの域に達するともいわれるペルソナシリーズの開発スタッフが手掛け、エヴァンゲリオンやニーアオートマタのデザイナーも参加した注目作です。

ゲーム音楽にインスパイア…されたはずだった

この「メタファー:リファンタジオ」で流れる音楽がとても魅力的で、特に「自由の翼」と「猛き者たちよ」という曲がお気に入りです。
特に「猛き者たちよ」は、実際の僧侶による読経をボーカルに採用し、エスペランド語の歌詞とオーケストラ、賛美歌的コーラスを組み合わせた独特の楽曲です。「こんな威厳のある楽曲を作ってみたい!」と思い立ち、主要な部分をサンスクリット語や仏教用語で歌詞に取り入れようと試行錯誤したり、Sunoで近い演奏になるようプロンプトを考えたりしましたが、難易度が高すぎて断念。
最終的には歌詞を一部ストレートに分かりやすく修正し、いつも聴いている馴染みのあるジャンルで完成させました。

最終的な作品
メタファーっぽい曲、と最終的にまったく関係がなくなってしまいましたが、
前作の感傷的な三部作とは対照的な方向性で仕上げました。

アニメソングバージョンは、サンスクリット語部分はそのままでちょっとだけ名残があります。

またリベンジしたいですし、チャンネル登録なんてしてもらえたらうれしいです。

最近のAI活用:Perplexity AIが制作の強力な相棒に

最近あまり触れていなかったAI関連の話題ですが、制作活動において欠かせないツールとなっているのがPerplexity AIです。国内やローカル情報を調べる場合には、Felo AIが優れています。特に日本語での検索精度や要約機能に強みがあり、学術論文の検索や情報整理にも便利です。しかし、Feloは検索結果の要約に特化しており、対話型で最新情報をもとに作業をサポートする用途には向いていません。
一方、Perplexity AIは、リアルタイムで最新の情報を取得しながら対話形式でサポートを提供できる点が大きな強みです。PCソフトや国際的な情報が必要な場合でも、Perplexityは迅速かつ正確な回答を提供します。また、大規模言語モデル(LLM)であるChatGPTやGemini、Claudeなどを別途利用する必要がなく、検索と対話を一つのプラットフォームで完結できるため非常に効率的です。

最新情報からプロンプト生成や問題解決も可能

Perplexity AIは、単なる検索ツールではなく、最新の情報をもとにプロンプト生成や問題解決をサポートする強力なツールです。例えば、画像生成AIや動画生成AIをローカル環境で使用している際に発生するエラーについても、最新の知識から解決策を提案してくれます。このようなリアルタイム対応は、頻繁にバージョンアップや仕様変更が行われるAIツールでは特に重要です。

対照的に、Felo Chat(Feloの提供する対話型機能)はリアルタイム検索機能を持たず、学習済みデータから回答を生成するため、新しい技術や仕様変更への対応には限界があります。そのため、AI分野の最新動向に追いつきながら効率的に作業を進めたい場合には、Perplexity AIが最適です。

しばらくはまだ、Perplexity を相棒として引き続き音楽や動画制作に励んでいきたいと思います。
※Perplexity Pro会員は、現在OpenAIのO1推論型モデルを1日10回、週70回まで利用可能になっています。(2025/01/05 現在)

動画生成AIの活用について

ローカル環境での動画生成AIは、性能向上が見られるものの、GPUを限界まで使用し、生成時間や画質の面で実用性に課題があります。そこで、現在活用している動画生成サービスを3つ、KLING、Vidu、Lumaをご紹介します。

①KLING AI

KLING AI 料金プラン(2025/1/5現在)

プラン価格(月額)クレジット数/月主な特徴
無料プラン無料66/日基本機能のみ、透かし付き
スタンダード$10660透かし除去、商用利用可
プロ$373,000高品質生成、優先処理
プレミア$928,000最高品質、最優先処理

以前はRunwayを主に使用していましたが、高額な料金が難点でした。それに対してKLING AIは、以下の特徴を持っています。(最初は割引ですごく安い)

KLING(クリング)は中国の快手科技(Kuaishou Technology)が開発した最先端の動画生成AIサービスです。2024年12月にバージョン1.6がリリースされ、さらなる性能向上を実現しています

高品質な動画生成

  • 1080p、30fpsの高解像度動画を最大2分まで生成可能
  • 物理法則に忠実な動きの表現が可能
  • 3D空間時間アテンションシステムによる自然な動作表現

バージョン1.6の改善点

  • 前バージョン1.5と比較して全体的な性能が195%向上
  • プロンプトの解釈精度が向上
  • 視覚的美観の強化
  • より自然な物理的動作の表現

提供機能

テキストから動画生成

  • プロンプトに基づいた動画の自動生成
  • フィクション題材も含む幅広い表現が可能

画像から動画生成

  • 静止画からの3Dモデル生成
  • リアルな動きの付加が可能

最新の評価

KLINGは現在、OpenAIのSoraに匹敵する、もしくはそれを超える性能を持つと評価されています。特に物理法則の表現や3D空間の理解において優れた性能を発揮し、より自然で破綻のない動画生成が可能となっています。

②Vidu

Viduは中国の生数科技(Shengshu Technology)と清華大学が共同開発した最新の動画生成AIプラットフォームです。独自のU-ViT技術を採用し、高品質な動画生成を実現しています。
アニメーション動画を手軽に作るのに私はViduを使っています。
他にはPikaKLING AIも安定性が高い。

Vidu 料金プラン(2025/1/5現在)

プラン価格(月額)クレジット数/月主な特徴
無料プラン無料80約20本の動画生成、透かし付き
スタンダード$9.99320透かし除去、商用利用可
アドバンス$29.99880高品質生成、同時3タスク
プレミアム$99.992,360最高品質、同時4タスク

主な特徴と機能

基本性能

  • 1080p、30fpsの高解像度動画生成が可能
  • 4秒の動画を約30秒で高速生成
  • 最大16秒までの動画長に対応

生成モード

  • テキストから動画生成(Text to Video)
  • 画像から動画生成(Image to Video)
  • 参照画像からの動画生成(Reference to Video)

特筆すべき機能

  • キャラクターの一貫性を保った動画生成が可能
  • アニメ風やリアル風など複数のスタイルに対応
  • 3D空間時間アテンションシステムによる自然な動作表現

③Luma AI(Dream Machine

Luma AIは、アメリカ・サンフランシスコ発のAI企業で、a16zを筆頭に4,300万ドルを調達し、約3,000台のNVIDIA A100 GPUを活用して最新のAIモデルを開発しています。
ループ動画を作りたいときに私はDream Machineを利用しています。
クレジット消費が1でわかりやすく、他のサービスより圧倒的に多く動画を作れる。

料金プラン(2025/1/5現在)

プラン価格月あたりの動画生成数
無料プラン無料30回
標準プラン29.99ドル120回
プロプラン99.99ドル400回
プレミアプラン499.99ドル2000回

主要サービス

Dream Machine

  • 最大4K解像度の高品質動画生成が可能
  • 5秒間の動画を高速生成
  • 120フレームの滑らかな動画表現
  • テキストや画像からの生成に対応

Photon

  • 2024年11月に発表された最新の画像生成AI
  • Dream Machineをベースとした高速な画像生成
  • デザイナーや映画制作者向けに最適化

最新の技術革新

性能向上

  • 2024年10月のアップデートで推論速度が10倍に向上
  • フル品質の動画生成が20秒以下で可能に
  • 品質を損なわない高速化を実現

独自技術

  • マルチモーダルTransformerモデルの採用
  • AWSとNVIDIA最新GPUによる高速処理
  • Neural Radiance Fields技術による高品質な3D表現

活用シーン

  • チェックボックスを押すだけでお手軽にループ動画を作れる
    (※ループ動画にはなっているけど、微妙な結果になることもある)

以上です。
これからやってみようと思う人に、ちょっとでもスタートの役に立てる内容があったらうれしいです。


音楽生成AIと、画像、動画生成AIで作る、センチメンタルシリーズ三部作 完成 ~AI時代の表現

絵を一枚描くのに、描き込みによっては丸一日を要することもあるでしょう。
作詞、作曲はどのくらいかかるんでしょう?相当な時間を要するはずです。
アーティストの方々には本当に頭が下がります。
AIテクノロジーの進化により、素人の私でも作品制作が可能になりました。とはいえ、一曲の完成までにSUNO AIで半日、画像、動画編集に12時間以上は費やしています。まだまだ効率化の余地があるかもしれません。

センチメンタルシリーズ三部作

社会の枠組みに収まれず、人と同じでいられない苦悩【LULLABY】
恋愛の歌かと思わせておいて、人間関係を歌っている【Distance】
守られた環境から独立し、現実へ向かっている不安を書いた【insecurities】

本シリーズは、感傷的で懐古的な要素を軸に展開しています。特徴として…
Claudにまとめてもらいました。

感情的要素

  • 社会との軋轢による心の痛み
  • 人間関係の機微と寂しさ
  • 成長に伴う不安と期待

普遍的テーマ

  • 自己実現への渇望
  • 人との距離感の模索
  • 自立への不安

心情の機微

  • 内面の葛藤
  • 繊細な感情の描写
  • 成長に伴う心の揺れ

メタな方ではこのような取り組みをしました

  • SUNO AIのペルソナ機能で統一したボーカル
  • 一貫したジャンルとスタイル
  • 今後チャンネルを象徴するキャラクター作りの原型
  • より洗練された映像表現への挑戦

制作過程で、服装の突然の変化や絵のタッチの揺らぎなど、AIならではの制限にはいつも直面していますし、私の編集技術も発展途上です。しかし、これらの経験は確実に成長につながっているはずです。実際、過去作品を振り返ると、その進歩を実感できるようになりました。
なお、チャンネル内では記載していませんが、本作品群は完全フリーの楽曲となっています。歌詞は素人の手作りですので、拙い表現はご容赦ください。
次は歌詞の洗練に注力したいと思っています。
ぜひ、初期の作品と見比べていただければ、この成長の軌跡を感じていただけるかと思います。

YouTubeチャンネル(チャンネル登録もしてくれたら嬉しいです!)


和楽器バンド 12/10 の Japan Tour 2024 THANKS  ~八奏ノ音~ を見に東京ガーデンシアターへ行ってきました

更新が滞り、約二週間前の出来事となってしまいました。

和楽器バンド、休止前の最後のライブ

活動休止前最後となったこのライブは、圧巻の内容でした。これまでの公演とは一線を画し、アーティストの強い感情が歌声と演奏を通じて直接響いてきました。終盤にはちょっとしたハプニングもあり、印象深いステージとなりました。このライブの模様は、Leminoにて2025年3月1日(土)から配信開始予定です。和楽器バンドを知っていても、まだ楽曲をよく知らない方にもぜひご覧いただきたいです。

和楽器バンドとの出会い

10年前、「千本桜」のMVとの出会いが始まりでした。当時はカプコンの「大神」というゲームの楽曲「太陽は昇る」を作業用BGMとして愛用していました。日本人なら涙腺緩むレベルの神曲だと思います。これがきっかけで和風の音楽を検索し漁って発見したのが「和楽器バンドの 千本桜」
当時は陰陽座というバンドの、和楽器を導入した本格的な人たちが出てきたくらいの認識で、さらにバンド名も相まって、現役で活動を続けているとは気付きませんでした。その後、「Perfect Blue」という曲に出会い、かなり聴きましたが、一時的なものに留まっていました。

メタルと和楽器バンド

普段はメタラーを自称しつつ、メタルとは程遠そうな和楽器バンドが好きになったのは理由があり、実は和楽器バンドの楽曲にはメタル要素のある曲も存在します。ただし、それだけが好きになった理由ではありません。

きっかけが一つあると見方が大きく変わる

大ファンになったのは、この方のリアクション動画から。
進撃の巨人や、鬼滅の刃の海外のリアクション動画を見ていた時に、おすすめ動画に表示されるようになったのですが、このサムネイル気になりますよね!
なんで泣いてるんだろうと。

ええもう、端折りますがこの動画を見た数日後、津軽三味線を買いに行きました。
アルバムもすべて買いました!

リアクション動画の影響

リアクション動画を通じて、このライブパフォーマンスが私に刺さりに刺さったとしか言いようがないです。
刺さった理由は多岐にわたります。まず、演奏内容にメタラーである私に響く要素が多くあったこと。そして、幼い頃から祖父と一緒に時代劇を見る機会が多く、三味線には馴染みがあったこと。さらに、再びゲームの話になりますが、「侍スピリッツ」という格闘ゲームを通じて三味線や尺八の音色を聴き慣れていたことも影響しています。前からちょっとだけ知っていたこのバンドが、こんな事もするんだと良い意味でイメージと違ったこと。そして何より、純粋にライブパフォーマンスが圧倒的にかっこよかったこと。

加えて、動画主のリアクションも盛り上げ効果になってたりました。
だって暁ノ糸の演奏が始まったら泣き出すんですから。
こちらまで感情を動かされますよね。

すべての点と点が線でつながった瞬間でした。

本当にもったいないバンド

熱弁したいことがたくさんあるのですが、そもそもこの記事に直接辿り着く人はすでに和楽器バンドのファンで間違いないと思いますし、他の記事から来た人でここまで読んでくれる人は稀であろうと思います。
その方の点と点が線でつながってないでしょうから控えめにしておこうと思います。

和楽器バンドのような存在は、本当に貴重で特別だと思います。音源が気軽に手に入らなかった時代、昔のバンドは演奏技術が非常に高かったといいます。それは、観客の前で一発勝負をするライブが主戦場だったからです。しかし、CDが普及してからは、ライブで「思ったより…」と感じさせるアーティストが増えたとも言われています。現代ではさらにサブスクリプションサービスが普及し、誰でも簡単に音楽を聴ける時代になりました。また、PC上でDAW(デジタルオーディオワークステーション)を使った作曲や、AIによる音楽制作も可能になっています。そのため、ボーカルだけでなく、自分たちで演奏まで高いレベルでこなすアーティストは今後ますます減少していくだろうと、とあるアーティストがラジオで語っていました。

和楽器バンドの特別さ

そんな中で、和楽器バンドのように伝統的な和楽器を取り入れながら、高い演奏技術でライブパフォーマンスを行うアーティストが今リアルタイムにいるのは本当に貴重なことです。彼らのライブは圧巻で、その魅力は他にはないものです。活動休止という寂しい状態ですが、再始動の日を楽しみに待ちたいと思っています。


insecurities という曲が3:54秒の動画なのに、平均視聴時間13:48、視聴維持率が350%を超えている(データ公開)

自身で書いた詩の中でも、特に手応えを感じた「insecurities」という作品に、Sunoが素晴らしいメロディーを付けてくれました。

制作背景 作曲の特徴

Sunoでの作曲には、具体的な楽器の指定ではなく、以下のような要素を指定しています

  • 「雰囲気がある」
  • 「メロディアス」
  • 「シューゲイザー」
  • 「シンコペーション」

また、ポップ調にする場合はJ-POPではなく「アニメ」を指定し、ベースにプログレッシブメタルを採用しています。
おそらくシューゲイザーだと思いますが、Sunoだと音質が悪いようなシャリシャリしたノイズっぽい音になる印象があります。しかし、それと引き換えに哀愁感のある曲になりやすいと感じています。

プログレッシブメタルをベースにすることで、哀愁のある旋律に力強い演奏が重なり、理想的な(自分好み)仕上がりになります。ただし、メタル特有のシャウトやがなり声(Adoで学習したでしょ…?って思える歌声になったりもする)を避けるため、ネガティブプロンプトでの制限が必要です。

当初は複雑なメッセージを込めるつもりでしたが、書いているうちにシンプルなものになりました。

そしてこのアナリティクスのデータ

リピート視聴率が驚異の1000%を超える一方、新規視聴者の割合は33%となっています。一般的に視聴者維持率40%以上が好ましいとされる中、若干下回る結果となりました。

特定の視聴者層に非常に強く響いた結果と考えられます。
とてもありがたいです。

興味深いことに、このような100%を超える数値について、GeminiやClaudなどのAIに相談すると、不正ツールの使用やYouTube Studioの集計バグではないかと指摘されます(笑)
AIに信じてもらえないこの思いも歌詞にできそうです。(YouTube側ではちゃんと、視聴者が巻き戻して複数回視聴した場合は100%を超える場合があると記載があります。)

改善点の明確化

再生回数が他の楽曲と比べて突出した伸びを見せない原因は、データから明確です。動画のタイトル設定とサムネイルデザインが、クリック率に直接影響していることが数値から読み取れます。

インプレッションのクリック率が非常に低いです。

一般的な目安

  • 2〜10%: 一般的に、YouTubeのCTRは2〜10%の範囲に収まることが多いと言われている。
  • 平均的なクリック率: 4~5%
  • 5%以上: 5%以上であれば、比較的良い数値と言える。これは、サムネイルとタイトルが効果的に視聴者の注意を引いていることを示唆しています。
  • 目標とすべき値: 5~8%
  • 最低ライン: 5%を下回ると「ユーザーから選択されない動画」と判断される

重要な注意点

  • ジャンルやトピックによって大きく変動する
  • クリック率が低いと、YouTubeのアルゴリズム評価が下がりインプレッション数も減少

AI音楽というニッチなジャンルと言う事もあるのですが、3~4分のわりと真面目な内容の曲に、クリックされるようなパワーワードって…難しいです。
「【衝撃】〇〇の裏側を暴露!」「【未公開映像】〇〇の真相に迫る」
「なぜ〇〇?驚愕の理由」「まさか〇〇だったとは…」みたいなやつです(笑)

サムネイルには、フォトショップが欲しいこの頃です。