AI幻聴(Audio Hallucination)とは?
読み方: オーディオハルシネーション
30秒まとめ
音声AIが実際には発言されていない内容を生成・認識する現象。WhisperやAI文字起こしで注意が必要。
AI幻聴(Audio Hallucination)の意味・定義
AI幻聴(Audio Hallucination)は、音声認識・文字起こしAIが実際には存在しない発言や内容を生成してしまう現象です。OpenAIのWhisperを代表とする現代の音声AIは高精度ですが、無音区間や雑音の多い録音、話者交代が頻繁な会議などで幻聴が発生しやすいことが報告されています。医療記録、法廷証言、ビジネス議事録など正確性が求められる分野では、AI生成結果を必ず人間が検証する運用が不可欠です。対策として、複数モデルでのクロスチェック、話者分離モデルの併用、ノイズ除去前処理、信頼度スコアが低いセグメントの除外などが有効です。2026年現在、Nvidia Parakeet-TDTやAssemblyAI Universal-2など、幻聴耐性を高めた新世代モデルの開発も進んでいます。