データドリフトとは?
読み方: データドリフト
30秒まとめ
本番運用中のAIモデルに入力されるデータの分布が、学習時と変化してしまう現象。
データドリフトの意味・定義
データドリフト(Data Drift)は、AIモデルの本番運用中に、入力データの統計的な分布が学習時のデータと比べて徐々に変化する現象です。これにより、モデルの予測精度が時間とともに低下する「モデル劣化」が発生します。AIモデルを作って終わりではなく、継続的な監視と再学習が必要な理由の一つです。 データドリフトの原因としては、ユーザー行動の変化、市場環境の変化、季節性、新しい商品・サービスの登場、データ収集方法の変更などがあります。例えば、コロナ禍では消費者の購買行動が激変し、多くのレコメンデーションAIの精度が低下しました。対策としては、入力データの分布を定期的に監視し、ドリフトを検出した際にモデルを再学習(リトレーニング)する仕組みの構築が重要です。MLOpsのモニタリングパイプラインに組み込むのが一般的な実践です。