抽出型要約(Extractive Summarization)とは?
読み方: ちゅうしゅつがたようやく
30秒まとめ
原文から重要な文をそのまま抜き出して要約を作る方式。原文に忠実だが言い回しは元のまま。
抽出型要約(Extractive Summarization)の意味・定義
抽出型要約(Extractive Summarization)は、原文の中から重要度の高い文や語句を選び、それらをそのまま並べて要約を作る方式です。文をゼロから生成しないため原文に忠実で、事実の取り違えやハルシネーション(原文にない内容の追加)が起きにくいのが利点ですが、抜き出した文の継ぎ目が不自然になったり、文脈がつながりにくいことがあります。これに対し、原文を理解して新しい言葉で言い直す方式を「生成型・抽象型要約(Abstractive Summarization)」と呼びます。ChatGPTやClaudeなどLLMベースの要約は主に抽象型で、人間が書いたような自然な要約を作れる一方、原文にない内容を作り出すリスクを伴います。TLDR ThisやScholarcyのようなツールは要点抽出を重視しますが、いずれの方式でも重要点の欠落や精度のばらつきは起こり得るため、意思決定にかかわる内容は人が原文を最終確認することが大切です。