L
LocalAIVtuber
ツール詳細ページ
← ツール比較に戻る ダッシュボード
⭐ GitHub Stars: 151
LocalAIVtuber
完全ローカル・オフラインで動作する AI VTuber。外部 API を一切使わず、プライバシーを完全に保護しながら配信できる。
無料
料金
推奨
NVIDIA GPU
Windows
対応 OS
完全オフライン
動作環境
概要

LocalAIVtuber は、インターネット接続不要で動作する完全ローカル AI VTuber システムです。 ローカル LLM(Ollama 等)が会話を生成し、VOICEVOX または Silero TTS が音声を合成、 VTube Studio と連携してアバターを動かします。 Gradio ベースの Web UI(localhost:7860)から設定・操作ができ、 日本語にも対応しています。外部サービスに一切依存しないため、 月額コスト 0 円・プライバシー完全保護での運用が可能です。

完全オフライン 月額 0 円 日本語対応 VOICEVOX 統合 VTube Studio 連携 Windows 専用
特徴
🔒
完全オフライン動作
ローカル LLM を使用するため、インターネット接続が一切不要。外部 API への通信なし。
🍏
VTube Studio 連携
VTube Studio と連携してアバターを制御。リアルタイムでリップシンクや表情変化が可能。
🔊
VOICEVOX / Silero TTS
VOICEVOX(日本語特化)と Silero TTS(多言語)に対応。高品質な音声合成が利用できる。
🏭
日本語完全対応
VOICEVOX 統合により日本語の自然な音声合成と会話生成に対応している。
💻
Gradio Web UI
ブラウザから localhost:7860 でアクセスできる直感的な管理画面を搭載。
🤖
ローカル LLM 対応
Ollama などのローカル LLM を使用して会話を生成。モデルは自由に選択可能。
メリット・デメリット
✓ メリット
月額ランニングコストが完全に 0 円
外部サービスに依存しないプライバシー完全保護
日本語対応・VOICEVOX 統合済みで日本語配信に最適
一度セットアップすれば半永久的にオフランで使用可能
✗ デメリット
Windows 専用。Mac・Linux では動作しない
NVIDIA GPU 推奨。非搭載環境では実用が困難
CUDA 設定が複雑で、初期セットアップのハードルが高い
モデルサイズによっては高 VRAM を要求される
システム要件
対応 OS Windows 専用
GPU NVIDIA 推奨
小型モデル
4 GB
VRAM
3B〜4B パラメータ
中型モデル
8〜12 GB
VRAM
7B〜14B パラメータ
大型モデル
16 GB+
VRAM
30B+ パラメータ
CUDA バージョン CUDA 12.4 推奨
Python 3.9 以上
追加ソフト VOICEVOX(日本語 TTS 使用時)、VTube Studio(アバター使用時)
インターネット 完全不要(オフライン動作)
CPU のみでも動作しますが、会話生成が極めて遅くなります。実用的な配信には NVIDIA GPU(VRAM 4GB 以上)を強く推奨します。 AMD GPU は CUDA 非対応のため基本的に利用不可です。
料金
¥0
完全無料・ローカル実行のみ
ソフトウェアの利用料・月額費用は一切かかりません。
ローカル LLM を使用するため API 費用も 0 円。
初期費用は GPU 搭載 PC のみです(既に所有している場合は追加費用なし)。
導入手順
1
GitHub Releases からダウンロード
GitHub の Releases ページから最新の zip ファイルをダウンロードして展開する。
2
CUDA と PyTorch をインストール
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
CUDA 12.4 に対応した PyTorch をインストールする。NVIDIA ドライバーが事前に必要。
3
依存パッケージをインストール
pip install -r requirements.txt
4
VOICEVOX を起動(日本語 TTS を使用する場合)
VOICEVOX を別途ダウンロードして起動しておく。ポート 50021 で待受。
5
アプリを起動
python main.py
6
Web UI でアクセス・設定
http://localhost:7860
ブラウザで上記 URL にアクセスし、LLM モデルや TTS 設定を行う。
運営イメージ
👤
視聴者
チャット入力
🤖
ローカル LLM
会話生成(オフライン)
🔊
VOICEVOX
音声合成(日本語)
🍏
VTube Studio
アバター制御
ネット接続不要で完全オフラインで配信できます。ローカル LLM が会話を生成し、 VOICEVOX が日本語音声を合成、VTube Studio がアバターを動かす構成です。 外部サービスへの依存がゼロなため、プライバシーを完全に保護しながら運用できます。 GPU 性能が会話の応答速度に直結するため、高 VRAM のグラフィックカードを推奨します。
こんな人におすすめ / おすすめしない
✓ おすすめな人
ランニングコストを完全に 0 にしたい人
プライバシーを重視しており、外部 API を使いたくない人
NVIDIA GPU(VRAM 4GB 以上)を既に所有している Windows ユーザー
VOICEVOX で日本語の自然な音声合成を使いたい人
✗ おすすめしない人
Mac ユーザー(Windows 専用のため動作しない)
GPU 非搭載または VRAM が 4GB 未満の環境
簡単なセットアップを求めている人(CUDA 設定が必要)
t2.micro 等のクラウドサーバーで動かしたい人(GPU 不足)