拡散モデル(Diffusion Model)とは?

読み方: カクサンモデル

30秒まとめ

ノイズから段階的にデータを生成する手法。画像・動画・音声生成AIの中核技術。

拡散モデル(Diffusion Model)の意味・定義

拡散モデル(Diffusion Model)は、ランダムなノイズから段階的にノイズを除去していくことで、高品質な画像・動画・音声を生成する生成AIの中核技術です。学習時にはデータにノイズを加える過程を学び、生成時にはその逆過程をたどってデータを復元します。 2026年現在、画像生成AI(Stable Diffusion、Midjourney、DALL-E 3、Flux)、動画生成AI(Sora、Runway、Kling AI)、音声合成AI(ElevenLabs)など、ほぼすべての生成AIが拡散モデルをベースに構築されています。最新の発展として、Latent Diffusion(潜在空間での拡散)、Consistency Models(高速生成)、Flow Matching(効率的な学習)などの技術革新が続いています。GANsと比較して学習が安定し、生成品質が高いため、クリエイティブAIの標準技術として確立されています。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール