アノテーションとは?
読み方: アノテーション
30秒まとめ
データに意味的な情報やラベルを付与する作業。AI学習データの品質を左右する基盤工程。
アノテーションの意味・定義
アノテーション(Annotation)は、テキスト・画像・音声・動画などのデータに意味的な情報やラベルを付与する作業の総称です。データラベリングとほぼ同義で使われることが多いですが、アノテーションはより広い概念で、バウンディングボックス(物体の位置を矩形で囲む)、セグメンテーション(ピクセル単位の領域分割)、固有表現抽出(テキスト中の人名・地名の特定)なども含みます。 アノテーションの品質管理は機械学習プロジェクトの成否を分ける重要な工程です。アノテーター間の一致率(Inter-Annotator Agreement)を測定し、ガイドラインの明確化やレビュープロセスの導入が不可欠です。近年はGPT-4やClaudeなどのLLMをアノテーション支援に活用するアプローチが増えており、コスト削減と品質向上の両立が可能になりつつあります。