Text-to-Video(テキストから動画生成)とは?
読み方: テキストトゥビデオ
30秒まとめ
テキストの説明文から動画を自動生成するAI技術。Sora、Runway、Kling AIなどが代表的。
Text-to-Video(テキストから動画生成)の意味・定義
Text-to-Video(テキストから動画生成)は、テキストプロンプトから動画コンテンツを自動生成するAI技術です。OpenAIのSora、RunwayのGen-3 Alpha、Kling AI、Pika、Google Veoなどのモデルが代表的です。拡散モデルやTransformerアーキテクチャをベースに、時間的な一貫性を保った動画フレームを生成します。数秒〜数十秒の動画を生成でき、映像制作のプロトタイピング、広告素材の作成、SNSコンテンツ制作などに活用されています。2024年以降急速に発展し、品質と生成時間の両面で大きな進歩を遂げています。