時代の流れに即した新たな情報の解釈法が求められています。
私たちは革新的なLLMフレームワークを構築し、文書からの関係抽出を目的とした「テンポラル知識グラフ(TKG)生成」タスクに焦点を当てました。
このフレームワークは、文脈に基づいて実体間の関係やタイムスタンプを抽出し、事実を構成することを目的とし、LoRAと呼ばれる効率的な微調整手法を使用して大規模言語モデル(LLM)を訓練します。
文書内の時間的な関係を抽出することは、単なる事実の正誤を決定するよりも複雑です。
そのため、我々はエンティティ、関係、タイムスタンプのリストから情報を選択し、意味のある四重項を生成するように、プロンプトを調整しました。
この手法により、歴史的なイベント分析やニュースの集約など、さまざまな応用が考えられます。
しかし、このアプローチには、LLMの微調整が大量のGPUリソースを必要とするという問題点があります。
また、エンティティリンクやタイムスタンプ抽出のエラーが関係抽出の性能を低下させることがあります。
本研究は、TKG構築の分野を前進させ、様々なドメインでの時間的推理の将来的な探求の基礎を提供します。
LLMは強力な生成能力と文脈の理解力を持ち、さらにこの分野の将来性を拓くことが期待されています。
出典 : A Temporal Knowledge Graph Generation Dataset Supervised Distantly by Large Language Models – Scientific Data https://www.nature.com/articles/s41597-025-05062-0