今日では、自動エッセイ採点(AES)は多様なアプローチを用いています。
伝統的な言語学的特徴や弁論分析から、効率的な低次元のコンテキスト表現(埋め込み)を学習するディープニューラルネットワークモデルまで幅広く存在します。
しかし、表層的な言語特徴に依存する採点法には限界があり、エッセイ全体の結びつきや一貫性を考慮しないため、意味のない高得点のエッセイが生まれることがあります。
独自のシステム「E-Rater」は、全体的な評価だけでなく、文法や語彙使用に関するリアルタイムな診断フィードバックも提供しており、高いモデル間の相関が認められました。
しかし、こういった単純で間接的な指標に依存したアプローチは、学生が良いエッセイを書くことよりも測定基準を満たすことに集中してしまうため、教育界に適切に受け入れられませんでした。
一方で、より複雑な意味関係や議論のパターンを把握する新しい手法が登場しています。
具体的には、テキストの可読性を計る方法や、テキストの一貫性を測る手法、そしてディープニューラルネットワークに基づくコンテキスト埋め込みや大規模言語モデル(LLM)を用いるアプローチが挙げられます。
これによって、特定のトピックにおけるエッセイの採点だけでなく、自由形式のテキストにも対応できるようになる動きがあります。
これらの技術的進化はAESの精度向上に貢献していますが、新たなトピックやデータへの適応という課題も残されています。
出典 : An LLM-based hybrid approach for enhanced automated essay scoring – Scientific Reports https://www.nature.com/articles/s41598-025-87862-3