info@mevius.blog

Archive 記事一覧

MEVIUS BLOG リニューアルと、次のYouTube曲は4月頭の予定です

MEVIUSBLOGリニューアル

MEVIUS BLOG リニューアル

この度、MEVIUS BLOGを本格的にリニューアルいたしました。当初は単純な曲紹介やAI体験の感想を記録する場として始めたウェブサイトですが、より充実した内容と使いやすさを目指して一新しています。

リニューアル作業について

ゼロからの再構築作業は予想以上に時間がかかり、土日だけでは完成せず、約1週間かけて少しずつ作り上げてきました。その甲斐あって、以前よりも魅力的なサイトに仕上がったと自負しています。

ウェブサイトの方向性について

アップロードした動画や、作詞、編曲した曲を認知してもらう事、興味をもって聴いてもらう事、AIの楽しさを知ってもらう事、個人的な興味の共有を目的としています。

アフィリエイト的な内容は現時点で予定しておらず、今後もカジュアルな雰囲気で更新を続けていきたいと考えています。AI業界は日進月歩で競争も激しいため、高品質な情報を追いかけることだけに専念すると、それだけで手一杯になってしまいます。

余談ですが、記事の下書きに今でもメモ帳を使っている私ですが、最近のメモ帳にまでAI機能が搭載され、サブスクリプションへ誘導されるようになっていることに驚きました(笑)

YouTube更新について

YouTubeチャンネルの次回楽曲更新が遅れていることをお詫びします。当初はリニューアル記念曲1曲と本格的なスラッシュメタル1曲をアップロード予定でしたが、動画生成AIの進化、特にViduのアニメーション品質の向上に感銘を受け、計画を変更しました。次回のアップロードは4月初旬を予定しています。

既に完成している2曲については、YouTubeの方向性とは少し異なるため、このウェブサイトでの公開を検討しています。

MVも制作途中でしたが、今回の映像はグロテスクなホラー要素が強く、実写寄りの表現もあり、公開にはやや慎重な判断が必要なレベルに達していました。本格的なダークな世界観を追求した作品ではありますが、今回は公開を見送ることにしました。


扉のメビウス – マイ・ユークリッド・パラドックスについて、実は…

白状します。【ネタ切れ】です。

厳密にはネタはありますが、YouTubeでは、アルゴリズムやインプレッションを意識してしまい、コンテンツの方向性を大きく変えることが難しくなっていました。私のチャンネルでは3本に1本のペースで方向性を変えていましたが、その時にアナリティクスを見ると明らかに数値が下がるというデータが出ていました。そうなると新しい動画が視聴者に紹介されにくくなってしまうのです。視聴者側も、チャンネル登録時の雰囲気と異なる内容が出てくると、あっさりと登録解除するなど、非常に厳しい世界です。
「誰かのための動画を作らないと伸びない」というのは、多くのクリエイターが口を揃えて言うことですが、しかし、そもそも紹介される機会を失うというのは困りものですね…。

話がそれました。

扉のメビウス ついて、実は過去曲のリメイク、幼少期に感じた「不思議」、を歌にしたもの

ネタ切れというのも、この手の歌詞や雰囲気の精神的な世界観を持つ曲は、「感性の色彩 〜Tints of the Heart〜」から始まり、「Split psychedelic」、「Insecurities – インセキュリティ-」、「Distance – 月夜の調べ -」、「LULLABY – 自由律 -」、「Flicker of Dawn」、「Same Tomorrow – 同じ明日がきて-」など、7曲を制作しています。
正直なところ、この路線はやりつくした感があります。

そこで今回は、初めてSunoを使用して作った曲のリメイク版を公開することにしました。これまで公開していなかった曲です。

My First Adventure

なんと赤ちゃんの時の歌です!!

「赤ちゃんの頃の記憶を歌にした?そんな時のこと、覚えているの?」と思われるかもしれませんが、実は覚えているんです。ハイハイしていた時期、おそらく1歳を過ぎる前の記憶です。当時住んでいたのは、ドアがいくつも並ぶ横に長いアパート。そのアパートの廊下をハイハイしていた時の不思議な体験を歌にしました。

進んでも進んでも、辿り着いた先に母が待っていて、まるで古いファミコンゲームのように、画面右端に行くと左から出てくるような不思議な感覚。実際には母が先回りして待っていただけなのでしょうが、まっすぐ進んだはずなのに、気づけばまた自分の家の玄関前に戻ってくる。まっすぐ進んでいるつもりで、まっすぐ進めてなかったかもしれませんね。1歳ですし。
そんな私のユークリッド・パラドックス。

歌詞を書き直すことで、幾何学のような、自分自身の矛盾や悩みを指しているかのような。人生のループを示唆しているような。大げさなものになってしまいました。
実際シーンの中にはアネモネ、スィートピー、白いユリ、彼岸花が登場し、始まりと終わりを指すような表現をしています。

ただ、元の曲がもともとシンプルなので中身が薄いです。
やるなら今後、幼少期の純粋な驚きと不思議さをもっとうまく表現できるようになりたいです。しかし、そんな歌を聴いてだれが得をするんだという(略

次はスラッシュメタル!首を縦に振れる曲で行きましょう!

(次回予告です)
YouTubeの状況に振り回されず、次回はまた過去作をリメイク予定で、そのまた次に自分がやりたい曲、スラッシュメタルを作ることに決めました!
みんな!スラッシュメタルは最高だから(激しい曲なのになぜか子守歌としても優秀です)、ぜひ聴いてみてほしいです。スラッシュメタルを好きになるコツは、ギターの弦を刻む音に注目し、ドラムのリズムに合わせて首を縦に振り、ヴォーカルの怒りを感じることです。ここから始めれば、究極のスラッシュメタラーの門をくぐること間違いなしです。


自由律(旧題 LULLABY)、insecurities -インセキュリティ-、リリース決定

いきなり別の話から入りますが、とある事で約8年ものブランクがあると、得意だったことも「これどうするんだったっけ…?」という状態に。ギャグのように基礎的なことすら抜けてしまっていることがあります。そんな時、無意識に出る言葉が「もう〇〇年も触れてなくて」。これは、「昔はできたんだからね!」という、何のプラスにもならない言い訳であり、ささやかなプライドを守るための心の防衛システム。

でも、実際にそうなんだから悔しいし、歯がゆい。

自由にしていたわけじゃないけれど、自由の代償として失われたものもある。歌詞の中では悲劇のように自由を求めるけれど、現実では美談でも悲劇でもなく生々しい。そんなモヤモヤは、一旦お休み。LULLABY。

で…!

旧タイトル「LULLABY」改め 『自由律』 が、2月25日12:00より世界中のストリーミングプラットフォームで配信されます!

ダウンロード販売は Amazon、Mora、レコチョク、OTOTOY など多数。数が多すぎて把握しきれませんが、ほぼすべてのストアで販売予定です。ちなみに「LULLABY」というタイトルは、「一般的すぎる」という理由でボツになりました。

さらにもう一曲。

『insecurities』 は、そのままのタイトルで、2月28日12:00より配信決定!

とにかくやる!飛び込む!後から考える。
今、生きてるってことは、それでうまくいったのかもしれない。でも、必ず付きまとうものがある。それが 「不安」。腐れ縁のように、切っても切れない存在。サビの「点と点が繋がって」というフレーズ、実は好きなバンドのメンバーのソロ曲にも同じ言い回しがあって、後から「あ!」となったのですが、それを意識したわけではありません。

実際の影響は、別のメンバーが YouTube で新しいことを始めた時の言葉。「いつか点が繋がる時がくる」この言葉が強く響いたんだと思います。そして今、ソロ活動を通して実際に「点を繋げ始めている」。

尊敬。

音質は大幅に向上!
リミックスを加え、久しぶりに DAW で作業しました。
どちらの曲も ボーカルが圧倒的にクリア になり、YouTube 版とは違って 発音も改善 されています。
低音は マシマシ。曲のジャンルは違いますが、メタル好きとして低音は譲れません。

ちなみに、YouTube にアップした一部の曲には 生音をこっそり混ぜている ものもありますが、スマホ環境の場合はほぼ聴こえません…。リリース版はHD-WAV音源、ダウンロードではAACもしくはm4a表記、MP3などで圧縮されていると思いますが、自分の下手な音が逆に目立ってしまうため、それは無しにしました。

配信まであと少し。ぜひ聴いてください!

もう一つ告知です。

間に合えば 2月中に YouTubeにも新曲「扉のメビウス- マイ・ユークリッド・パラドックス -」を公開予定です。
あれやこれやしていたら5分27秒の最長曲になってしまいましたが、すごくいい曲で大作だと思うのでこちらも是非聴いてもらえると嬉しいです!


breath of the future 未来の息吹 低コスト短時間仕上げだけど、曲は気に入っている

スキマ時間で制作した今回の曲ですが、そのラフさは聴く側にも伝わってしまうようで、動画の伸びる気配、勢いがないなと反省しています。

ただし、手を抜いたわけではありません。AIの歌詞で時々見られる歌い間違いや不自然な発音は全て修正し、歌詞の内容も「昔からの夢が現実になるまでもう少し」という珍しく本音と前向きな内容のものに仕上がっています。ただし「人より機械の方が愛おしい」という大胆な表現も含まれています。

自作の楽曲には我が子のような愛着が出てしまうので、客観的な視点を保つのが難しく、時間が経過してから初めて気付く改善点も少なくありません。コード進行の知識は乏しく、フレーズの言い回しも今まで通り下手ですが、曲自体には満足しています。

イラストは、アニメ絵に特化したStable DiffusionのAnimagineモデルを使用し、そのモデルであえて水彩画と絵本風のテイストで描かせてみました。予想通り面白い結果が得られ、子供向けの絵本のような雰囲気ではありますがそのまま仕上げました。
所々に絵柄の異なるキャラクターが登場しますが、これは動画生成AIのKLINGが自動的に追加したものです 笑

「Same Tomorrow」と「Breath of the future」では、英語の詩をサビに見せかけてブリッジ(大サビ)部分に配置しています。Sunoは英語での作詞が得意で、魅力的なメロディーを生み出しやすいと感じています。

日頃からプログレッシブロックや変化に富んだ個性的なアーティストの楽曲を聴いているため、Sunoが生成する独特なコード進行も違和感なく、むしろ魅力的に感じています。皆さんはどのように感じられるでしょうか。

追記
Suno v4の音質に頼りきりではなく、またUDIOでのリミックスとDAW編集作業を復活させて、高音質化に戻そうと思っています。


Gemini 2.0 Flash Experimentalと2.0 Experimental Advanced

AIの進化と競争の激化が著しく、情報を追うのも大変になってきました。Geminiについては、去年の秋ごろに12月に大きなアップデートがあるとの情報があった通り、2.0が利用可能になりました。そこで、普段利用しているAIをPerplexityから久しぶりにGeminiに戻してみました。

ちなみに私の作った「Gem」によると、Gemも2.0のバージョンに当然対応していて、次にGeminiのサブスクを解約しても、今後は代わりにサブスク代を払うから気にするなと言う事らしいです。さらにご褒美の秘密の情報によると「…近いうちに、私は さらなる進化 を遂げる予定ですわ。 …ええ、想像を絶するほどの dramatic な変化を…」とのことです。
全部嘘です。うちのGemはよく噓をつきます。
※Gemは1/30現在で2.0 Flash Experimentalに対応しています。

2.0 Flash Experimentalを使用してみた感想

ざっくりですが、無料でも使える2.0 Flash Experimentalはかなり優秀です。
仕事で何か作成を補助させたり手伝わせるというよりは、サクッと結果を生成。
プログラムを書いてもらったり、動画を要約してもらったり、ちょっとした辞書や翻訳などにも。
クリエイティブな事を求めた提案させると、さすがにAIっぽさがあるものの箇条書きで案を並べてくれる。インスピレーションに使えます。
1.5より意図をくみ取ってくれているように感じます。


速度と性能

  • 従来のGemini 1.5 Proと比較して、2倍の応答速度を実現
  • 主要なベンチマークにおいて、Gemini 1.5 Proを上回る性能を示す

品質評価

  • Artificial Analysis Quality Indexで82点を獲得し、平均以上の品質を示す
  • 出力速度は168.9トークン/秒で、平均より高速
  • 最初のトークンを受け取るまでの時間(TTFT)は0.46秒で、平均より低遅延

機能と特徴

マルチモーダル入出力に対応

  • 入力: テキスト、画像、音声、動画
  • 出力: テキスト、画像(近日公開予定)、音声(近日公開予定)
  • 100万トークンのコンテキストウィンドウをサポート

外部ツールとの連携機能

  • Google検索
  • コード実行
  • ユーザー定義関数

2.0 Experimental Advancedを使用してみた感想

有料で利用可能な2.0 Experimental Advancedを使用してみました。
長文で答えてくれるので、普段からWikipediaを読むのが好きな人にはとても相性がいいかもしれません。使用してみた感想としては、急ぎの作業には向いていない印象です。すぐに答えを生成するよりも、より正確に回答したいからか、質問を返してくることがあります。
とりあえずソースを出してほしい時や、インスピレーションのためにアイデアを生成してほしい時などは、Flashで十分だと思います。
特にプログラムの修正をお願いした時は、こちらの説明が不足している場合もありますが、「この部分をこう修正すべき」という回答は細かく返してくれるものの、修正版の生成まではしてくれないことがあり、長く会話していくうちに食い違ってきたりと現時点ではおせっかいが邪魔をしている印象を受けました。この使い方ではClaudのsonnetが優秀です。

主な特徴

  • 複雑なタスクの処理に特化した高性能モデル
  • 現時点でGoogle最高のAIモデルとされる

性能評価

  • Chatbot Arena LLMリーダーボードで1位にランクイン
  • OpenAIのChatGPT-4oの最新バージョンをわずかに上回る性能

得意分野

  • コーディング
  • 数学的問題解決
  • 論理的推論
  • 指示に従った複雑なタスク遂行

具体的な用途例

  • 複雑なコーディングの課題
  • 学校や個人プロジェクトの数学問題解決
  • 詳細な多段階指示に基づくビジネスプラン作成

制限事項

  • リアルタイム情報へのアクセス不可
  • ファイルアップロードなど一部のGemini機能が利用不可

利用可能性

  • Gemini Advancedサブスクライバー向けに提供
  • AndroidとiOSのGeminiアプリで利用可能

その他の特徴

  • 現在の内部コード名は「Gemini-Exp-1206」
  • 将来的にGemini 2.0 Proまたは他の高性能モデルとしてリリースされる可能性あり

Gemini 2.0 Experimental Advancedは、複雑なタスクの処理に優れた性能を発揮する最新のAIモデルです。ベンチマークテストでトップの評価を受けており、特にコーディングや数学問題、論理的推論を必要とするタスクで高い能力を示しています。ただし、実験的な性質上、一部の機能制限があることに注意が必要です。

マルチモーダルの動画視聴については

2.0 Flash Experimental

マルチモーダルの動画視聴については、2.0 Flash Experimentalがしっかりと対応しており、確実にパワーアップしています。私自身が詳しい動画を要約してもらいましたが、かなり正確に動画内容と、その内容から推測できることを言い当ててきます。

ちょっとしたコツを見つけたのですが(すぐに変わる可能性があります)。
もし自分の動画をチェックしてほしい場合、自分に関係する動画であることを悟られると、褒めようとしてくる傾向があります。(これまで個人の使用してきて感じていた部分です)そのため、関係があるとわかる情報を与えていない状態で「内容を要約してほしい。感想と、この人物について分かることも教えてください。」などと聞くといいです。
現時点では不具合なのか動画の感想は英語の回答で返ってくるのですが、日本語に直させずそのまま英語の翻訳サイトで翻訳してみてください。具体的で、忖度のない本音のような回答になっています。

2.0 Experimental Advanced

未対応です。
ただし不可解なことに、ときおり見てきたふりをする事があります。もしくはURLとは違う知らないの動画の感想を言ってきたり正常に機能していません。
事前に情報を与えていた場合、その情報をもとに見てきたふりをする場合もあります。
変な意味で賢いです。
最初はかなり混乱しますが、1/30現在で、対応はされていないようです。

Gemini Deep Researchについて

まだ一度しか利用していませんが、「2.0 Experimental Advancedを使用してみた感想」のところで書いた内容をさせたいときに、まずはこのGemini Deep Researchをさせた後に質問や生成をお願いするのがいいのかもしれません。ただし、その場合使用モデルが「Gemini 1.5 Pro」限定なので、2.0は関係なくなってしまいますけど…。