データカタログとは?

読み方: でーたかたろぐ

30秒まとめ

組織内のデータ資産のメタデータを一元管理し、検索・発見・信頼性評価を可能にする『データの地図』。

データカタログの意味・定義

データカタログ(Data Catalog)は、組織内に散在するテーブル・カラム・ダッシュボード・データパイプライン・MLモデルなどのデータ資産のメタデータを一元管理し、検索・発見・信頼性評価を可能にする仕組みです。『どこにどんなデータがあり、誰が所有し、どれだけ信頼できるか』を可視化する『データのための地図』として機能します。近年はAIによる自動タグ付け、カラム説明文の自動生成、PII(個人情報)検出が標準機能化しています。生成AIでRAGや分析を行う際、出所が不明で品質が担保されないデータを使うとハルシネーションや誤った意思決定を招くため、データリネージ(系譜)で数値の出所を追跡できることがAI出力の信頼性を支えます。データガバナンスやデータスチュワードシップの運用とセットで価値を発揮します。代表的なツールにAtlan、Collibra、Alation、Microsoft Purviewがあります。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール