LocalAIVtuber 詳細 - AI VTuberツール

⭐ GitHub Stars: 151

LocalAIVtuber

完全ローカル・オフラインで動作する AI VTuber。外部 API を一切使わず、プライバシーを完全に保護しながら配信できる。

無料

料金

推奨

NVIDIA GPU

Windows

対応 OS

完全オフライン

動作環境

概

概要

LocalAIVtuber は、インターネット接続不要で動作する完全ローカル AI VTuber システムです。ローカル LLM（Ollama 等）が会話を生成し、VOICEVOX または Silero TTS が音声を合成、 VTube Studio と連携してアバターを動かします。 Gradio ベースの Web UI（localhost:7860）から設定・操作ができ、日本語にも対応しています。外部サービスに一切依存しないため、月額コスト 0 円・プライバシー完全保護での運用が可能です。

完全オフライン月額 0 円日本語対応 VOICEVOX 統合 VTube Studio 連携 Windows 専用

特

特徴

🔒

完全オフライン動作

ローカル LLM を使用するため、インターネット接続が一切不要。外部 API への通信なし。

🍏

VTube Studio 連携

VTube Studio と連携してアバターを制御。リアルタイムでリップシンクや表情変化が可能。

🔊

VOICEVOX / Silero TTS

VOICEVOX（日本語特化）と Silero TTS（多言語）に対応。高品質な音声合成が利用できる。

🏭

日本語完全対応

VOICEVOX 統合により日本語の自然な音声合成と会話生成に対応している。

💻

Gradio Web UI

ブラウザから localhost:7860 でアクセスできる直感的な管理画面を搭載。

🤖

ローカル LLM 対応

Ollama などのローカル LLM を使用して会話を生成。モデルは自由に選択可能。

評

メリット・デメリット

✓ メリット

月額ランニングコストが完全に 0 円

外部サービスに依存しないプライバシー完全保護

日本語対応・VOICEVOX 統合済みで日本語配信に最適

一度セットアップすれば半永久的にオフランで使用可能

✗ デメリット

Windows 専用。Mac・Linux では動作しない

NVIDIA GPU 推奨。非搭載環境では実用が困難

CUDA 設定が複雑で、初期セットアップのハードルが高い

モデルサイズによっては高 VRAM を要求される

要

システム要件

対応 OS	Windows 専用
GPU	NVIDIA 推奨小型モデル 4 GB VRAM 3B〜4B パラメータ中型モデル 8〜12 GB VRAM 7B〜14B パラメータ大型モデル 16 GB+ VRAM 30B+ パラメータ
CUDA バージョン	CUDA 12.4 推奨
Python	3.9 以上
追加ソフト	VOICEVOX（日本語 TTS 使用時）、VTube Studio（アバター使用時）
インターネット	完全不要（オフライン動作）

⚠

CPU のみでも動作しますが、会話生成が極めて遅くなります。実用的な配信には NVIDIA GPU（VRAM 4GB 以上）を強く推奨します。 AMD GPU は CUDA 非対応のため基本的に利用不可です。

円

料金

¥0

完全無料・ローカル実行のみ

ソフトウェアの利用料・月額費用は一切かかりません。
ローカル LLM を使用するため API 費用も 0 円。
初期費用は GPU 搭載 PC のみです（既に所有している場合は追加費用なし）。

導

導入手順

GitHub Releases からダウンロード

GitHub の Releases ページから最新の zip ファイルをダウンロードして展開する。

CUDA と PyTorch をインストール

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

CUDA 12.4 に対応した PyTorch をインストールする。NVIDIA ドライバーが事前に必要。

依存パッケージをインストール

pip install -r requirements.txt

VOICEVOX を起動（日本語 TTS を使用する場合）

VOICEVOX を別途ダウンロードして起動しておく。ポート 50021 で待受。

アプリを起動

python main.py

Web UI でアクセス・設定

http://localhost:7860

ブラウザで上記 URL にアクセスし、LLM モデルや TTS 設定を行う。

運

運営イメージ

👤

視聴者

チャット入力

→

🤖

ローカル LLM

会話生成（オフライン）

→

🔊

VOICEVOX

音声合成（日本語）

→

🍏

VTube Studio

アバター制御

ネット接続不要で完全オフラインで配信できます。ローカル LLM が会話を生成し、 VOICEVOX が日本語音声を合成、VTube Studio がアバターを動かす構成です。外部サービスへの依存がゼロなため、プライバシーを完全に保護しながら運用できます。 GPU 性能が会話の応答速度に直結するため、高 VRAM のグラフィックカードを推奨します。

判

こんな人におすすめ / おすすめしない