インストラクションチューニングとは?
読み方: インストラクションチューニング
30秒まとめ
人間の指示に適切に応答できるよう、多様な指示-応答ペアでモデルを調整する手法。
インストラクションチューニングの意味・定義
インストラクションチューニング(Instruction Tuning)は、LLMが人間の指示(インストラクション)に的確に従えるように、多様な指示と応答のペアデータでモデルを追加学習させる手法です。事前学習済みのLLMは膨大なテキストの統計パターンを学習していますが、そのままでは人間の意図を正確に理解して応答することが困難です。インストラクションチューニングにより、「要約して」「翻訳して」「コードを書いて」といった多様な指示に対して適切に応答できるようになります。Google のFLAN-T5やMetaのLlama 2-Chatなどがこの手法で調整されています。RLHFと組み合わせることで、さらに人間の好みに沿った出力が可能になります。