text-generation-webui

AIローカルLLM

text-generation-webui(oobabooga)はGradioベースのローカルLLM実行WebUI。GPTQ、GGUF、AWQ、EXL2等あらゆる量子化形式に対応し、最も多機能なオープンソースLLMフロントエンド。

4.3
日本語対応: 非対応
WindowsMacLinux

text-generation-webuiとは?

text-generation-webui(テキストジェネレーションウェブUI、通称oobabooga)は、GradioベースのWebインターフェースでローカルLLMを実行するオープンソースツールです。GPTQ、GGUF、AWQ、EXL2、HQQ等、あらゆる量子化フォーマットに対応しており、Hugging Faceの膨大なモデルリポジトリから好きなモデルをダウンロードして実行できます。 text-generation-webuiの強みは圧倒的な多機能性です。チャットモード、ストーリーモード、Notebookモード(テキスト補完)の3つのモードに加え、LoRA/QLoRAのファインチューニング、APIサーバー(OpenAI互換)、キャラクターカード対応、Multimodal(画像入力)、Extension(拡張機能)システムなど、ローカルLLMに必要な機能がほぼすべて網羅されています。まさに「何でもできるLLMフロントエンド」です。 Extensionシステムにより機能を自由に拡張できます。AllTalk TTS(音声合成)、Whisper STT(音声入力)、long_term_memory(長期記憶)、sd_api_pictures(Stable Diffusion連携)など、コミュニティが開発した多数のExtensionが利用可能です。バックエンドはTransformers、llama.cpp、ExLlamaV2、AutoGPTQ等に対応し、GPUメモリの使用量やレイヤー分割なども詳細に設定できます。パワーユーザーにとって最も自由度の高いLLM実行環境です。

text-generation-webuiのスクリーンショット

料金プラン

1完全無料(オープンソース・AGPL-3.0ライセンス)

主な機能・特徴

チャット・ストーリー・Notebookの3モード
GPTQ・GGUF・AWQ・EXL2・HQQ形式対応
Hugging Faceモデル直接ダウンロード
LoRA/QLoRAファインチューニング(GUI対応)
OpenAI互換APIサーバー
Extension(拡張機能)システム
マルチモーダル(画像入力)対応
キャラクターカード対応
GPU レイヤー分割・メモリ管理
TTS・STT連携Extension

メリット・デメリット

メリット

  • あらゆる量子化形式(GPTQ・GGUF・AWQ・EXL2等)に対応
  • Hugging Faceモデルの直接ダウンロード機能
  • LoRA/QLoRAファインチューニングをGUI上で実行可能
  • Extension(拡張機能)システムで自由にカスタマイズ
  • OpenAI互換APIサーバー内蔵
  • 最も多機能なオープンソースLLMフロントエンド

デメリット

  • 機能が多すぎて初心者には圧倒される
  • セットアップにPython環境の構築が必要
  • UIがやや複雑で直感的でない部分がある
  • 高性能GPU(VRAM 8GB以上)を推奨

よくある質問(FAQ)

Q. text-generation-webuiのセットアップは難しいですか?

A. ワンクリックインストーラーが提供されており(Windows/Mac/Linux)、基本的なセットアップは比較的簡単です。ただし、特定のGPU環境でのCUDA設定やExtensionの導入には、ある程度のPython・コマンドラインの知識が役立ちます。初心者にはOllamaやLM Studioの方がセットアップが容易です。

Q. OllamaやLM Studioとの違いは?

A. text-generation-webuiは多機能性が最大の強みで、ファインチューニング、Extension、あらゆる量子化形式への対応など、パワーユーザー向けの機能が充実しています。OllamaはシンプルさとAPI、LM StudioはGUIの使いやすさが強みです。カスタマイズの自由度を最重視するならtext-generation-webuiが最適です。

Q. ファインチューニングは本当にGUIで可能ですか?

A. はい、Training タブからLoRA/QLoRAのファインチューニングをGUI上で実行できます。トレーニングデータの準備、ハイパーパラメータの設定、学習の実行・モニタリングがすべてWeb UI上で完結します。ただし、ファインチューニングにはVRAM 16GB以上のGPUが推奨されます。

関連ツール

活用シーン・用途別ガイド

運営者が開発したAIマーケティングツール