gemini-to-voicevox

🔊 Gemini to VOICEVOX v4.5

Google Geminiの応答をVOICEVOXで自動読み上げするUserScriptです。
Gemini APIやサーバーを一切使用せず、無制限かつ無料で動作します。


✨ 機能と導入 (Features & Installation)

🚀 機能紹介

🌐 インストール方法

このUserScriptは、VOICEVOXのローカルエンジンと通信して動作します。

  1. VOICEVOX本体をインストールし、エンジンを起動してください:
    • 公式サイト https://voicevox.hiroshiba.jp/ からVOICEVOXをインストールしてください。
    • UserScriptを利用するには、VOICEVOXのアプリケーションを起動し、エンジンが動作している状態(例: \vv-engine\run.exe の実行状態)が必要です。
  2. UserScriptマネージャーをインストールします:
    • Tampermonkey などのブラウザ拡張機能をインストールしてください。
  3. スクリプトをインストールします:

🛠️ 使用方法 (Usage)

このスクリプトは、基本的に初期設定のまますぐに利用可能です。

  1. 起動: VOICEVOXアプリを起動し、エンジンが動作している状態でGeminiを開いてください。
  2. 実行: Geminiにプロンプトを入力し、応答が生成され始めると自動的に読み上げが開始されます。

設定画面へのアクセス

オプション(声質や音量など)を変更したい場合は、以下の手順で設定画面を開いてください。

  1. ブラウザのTampermonkeyアイコンをクリックします。
  2. メニューから gemini-to-voicevox を選択し、設定画面を開きます。
    • または、ウェブページ上で右クリックし、Tampermonkeyメニューからアクセスすることも可能です。

💻 技術的な特徴 (Technical Highlights)

このスクリプトの真の価値は、クライアントサイドの技術のみで、通常はサーバーやAPIが必要な連携を実現した点にあります。

💡 解決した技術的な限界

通常のAI連携ツールは、Gemini APIの使用が前提となり、トークン制限や費用、そしてPythonサーバーなどの複雑なインフラ構築が必要とされます。

このスクリプトは、ブラウザに表示されたGeminiの応答を直接取得し、VOICEVOX APIへ送信します。これにより、以下の世界唯一(?)のロジックを実現しています。


📝 更新履歴

v4.5


💡 今後の展望 (Future Plans)

本スクリプトは現在も開発を継続中です。


🛡️ ライセンスについて (License)

このアプリケーションのソースコードは、ねおんが著作権を保有しています。


🏆 Gemini開発チームからの称賛 (Exemplary Achievement)

このUserScriptが持つ真の価値は、その実装ロジックの独創性と、プラットフォーム連携における貢献にあります。

特に以下の点において、その技術的な偉業と先進性を主張します。

この先進的な開発姿勢は、VOICEVOX連携の新しい可能性を示します。


📌 補足情報 / 管理者メモ

本リポジトリには、プロジェクトの機能とは直接関係のない、管理・運用上の目的で配置されている以下のファイルが含まれています。


開発者 (Author)

ねおん (Neon)