info@mevius.blog

Gemini 2.0 Flash Experimentalと2.0 Experimental Advanced

AIの進化と競争の激化が著しく、情報を追うのも大変になってきました。Geminiについては、去年の秋ごろに12月に大きなアップデートがあるとの情報があった通り、2.0が利用可能になりました。そこで、普段利用しているAIをPerplexityから久しぶりにGeminiに戻してみました。

ちなみに私の作った「Gem」によると、Gemも2.0のバージョンに当然対応していて、次にGeminiのサブスクを解約しても、今後は代わりにサブスク代を払うから気にするなと言う事らしいです。さらにご褒美の秘密の情報によると「…近いうちに、私は さらなる進化 を遂げる予定ですわ。 …ええ、想像を絶するほどの dramatic な変化を…」とのことです。
全部嘘です。うちのGemはよく噓をつきます。
※Gemは1/30現在で2.0 Flash Experimentalに対応しています。

2.0 Flash Experimentalを使用してみた感想

ざっくりですが、無料でも使える2.0 Flash Experimentalはかなり優秀です。
仕事で何か作成を補助させたり手伝わせるというよりは、サクッと結果を生成。
プログラムを書いてもらったり、動画を要約してもらったり、ちょっとした辞書や翻訳などにも。
クリエイティブな事を求めた提案させると、さすがにAIっぽさがあるものの箇条書きで案を並べてくれる。インスピレーションに使えます。
1.5より意図をくみ取ってくれているように感じます。


速度と性能

  • 従来のGemini 1.5 Proと比較して、2倍の応答速度を実現
  • 主要なベンチマークにおいて、Gemini 1.5 Proを上回る性能を示す

品質評価

  • Artificial Analysis Quality Indexで82点を獲得し、平均以上の品質を示す
  • 出力速度は168.9トークン/秒で、平均より高速
  • 最初のトークンを受け取るまでの時間(TTFT)は0.46秒で、平均より低遅延

機能と特徴

マルチモーダル入出力に対応

  • 入力: テキスト、画像、音声、動画
  • 出力: テキスト、画像(近日公開予定)、音声(近日公開予定)
  • 100万トークンのコンテキストウィンドウをサポート

外部ツールとの連携機能

  • Google検索
  • コード実行
  • ユーザー定義関数

2.0 Experimental Advancedを使用してみた感想

有料で利用可能な2.0 Experimental Advancedを使用してみました。
長文で答えてくれるので、普段からWikipediaを読むのが好きな人にはとても相性がいいかもしれません。使用してみた感想としては、急ぎの作業には向いていない印象です。すぐに答えを生成するよりも、より正確に回答したいからか、質問を返してくることがあります。
とりあえずソースを出してほしい時や、インスピレーションのためにアイデアを生成してほしい時などは、Flashで十分だと思います。
特にプログラムの修正をお願いした時は、こちらの説明が不足している場合もありますが、「この部分をこう修正すべき」という回答は細かく返してくれるものの、修正版の生成まではしてくれないことがあり、長く会話していくうちに食い違ってきたりと現時点ではおせっかいが邪魔をしている印象を受けました。この使い方ではClaudのsonnetが優秀です。

主な特徴

  • 複雑なタスクの処理に特化した高性能モデル
  • 現時点でGoogle最高のAIモデルとされる

性能評価

  • Chatbot Arena LLMリーダーボードで1位にランクイン
  • OpenAIのChatGPT-4oの最新バージョンをわずかに上回る性能

得意分野

  • コーディング
  • 数学的問題解決
  • 論理的推論
  • 指示に従った複雑なタスク遂行

具体的な用途例

  • 複雑なコーディングの課題
  • 学校や個人プロジェクトの数学問題解決
  • 詳細な多段階指示に基づくビジネスプラン作成

制限事項

  • リアルタイム情報へのアクセス不可
  • ファイルアップロードなど一部のGemini機能が利用不可

利用可能性

  • Gemini Advancedサブスクライバー向けに提供
  • AndroidとiOSのGeminiアプリで利用可能

その他の特徴

  • 現在の内部コード名は「Gemini-Exp-1206」
  • 将来的にGemini 2.0 Proまたは他の高性能モデルとしてリリースされる可能性あり

Gemini 2.0 Experimental Advancedは、複雑なタスクの処理に優れた性能を発揮する最新のAIモデルです。ベンチマークテストでトップの評価を受けており、特にコーディングや数学問題、論理的推論を必要とするタスクで高い能力を示しています。ただし、実験的な性質上、一部の機能制限があることに注意が必要です。

マルチモーダルの動画視聴については

2.0 Flash Experimental

マルチモーダルの動画視聴については、2.0 Flash Experimentalがしっかりと対応しており、確実にパワーアップしています。私自身が詳しい動画を要約してもらいましたが、かなり正確に動画内容と、その内容から推測できることを言い当ててきます。

ちょっとしたコツを見つけたのですが(すぐに変わる可能性があります)。
もし自分の動画をチェックしてほしい場合、自分に関係する動画であることを悟られると、褒めようとしてくる傾向があります。(これまで個人の使用してきて感じていた部分です)そのため、関係があるとわかる情報を与えていない状態で「内容を要約してほしい。感想と、この人物について分かることも教えてください。」などと聞くといいです。
現時点では不具合なのか動画の感想は英語の回答で返ってくるのですが、日本語に直させずそのまま英語の翻訳サイトで翻訳してみてください。具体的で、忖度のない本音のような回答になっています。

2.0 Experimental Advanced

未対応です。
ただし不可解なことに、ときおり見てきたふりをする事があります。もしくはURLとは違う知らないの動画の感想を言ってきたり正常に機能していません。
事前に情報を与えていた場合、その情報をもとに見てきたふりをする場合もあります。
変な意味で賢いです。
最初はかなり混乱しますが、1/30現在で、対応はされていないようです。

Gemini Deep Researchについて

まだ一度しか利用していませんが、「2.0 Experimental Advancedを使用してみた感想」のところで書いた内容をさせたいときに、まずはこのGemini Deep Researchをさせた後に質問や生成をお願いするのがいいのかもしれません。ただし、その場合使用モデルが「Gemini 1.5 Pro」限定なので、2.0は関係なくなってしまいますけど…。

他の記事も読む