コンスティテューショナルAIとは?

読み方: コンスティテューショナルエーアイ

30秒まとめ

AIに倫理的原則の「憲法」を与え、安全で価値観に沿った振る舞いを実現するAnthropicの手法。

コンスティテューショナルAIの意味・定義

コンスティテューショナルAI(Constitutional AI)は、Anthropicが開発したAIの安全性・アラインメント手法です。AIモデルに事前に定義された倫理的原則のセット(「憲法」)を与え、その原則に従って自己評価・自己修正を行うよう訓練します。従来のRLHF(人間のフィードバックからの強化学習)では大量の人間のラベラーが必要でしたが、Constitutional AIではAI自身が憲法に照らして回答を批評・改善するため、より効率的かつスケーラブルに安全性を実現できます。2026年1月には、AnthropicがClaudeの新しい憲法「Claude's Guidelines Spec」を公開し、従来のルールベースのアプローチから、原則の背景にある理由(Why)も含めた「理由ベースのアラインメント」への移行を発表しました。この手法により、Claudeは未知の状況でも適切に判断する能力が向上し、AIの安全性研究における重要なマイルストーンとなっています。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール