言語能力と知識の構造を理解しようという試みは、長らく人間の領域で研究されてきました。最近では、この問題が人工知能、特に大規模言語モデル(LLMs)の分野で関連性を増しています。
人間の意味記憶に関する研究方法は、言語モデルの中での概念知識を探る手法としても応用されていますが、従来のワードエンベッディングの限界や新たな方法論の採用が提案されているのです。
そこで、我々はLLMsにより生成された、巨大なスケールの英語自由連想規範データセット「LWOW」を新たに提示しました。これは、人間による連想データと比較可能であり、LLMsがどのように概念知識を構築しているかを探る貴重な資源となるでしょう。
研究者たちは、新しい「機械心理学」アプローチを通して、LLMsの言語理解と人間のそれとを比較することにより、どのようにして我々の認識構造や社会的、政治的体系が形成されるかについての洞察を得ることを目指しています。
出典 : The “LLM World of Words” English free association norms generated by large language models – Scientific Data https://www.nature.com/articles/s41597-025-05156-9