イスラエルのNGO「Madrasa」では、ヘブライ語話者にアラビア語を教えています。この団体が実施するアンケートに対する学生の回答から、価値ある洞察を引き出すため、私たちは多言語に対応した言語処理技術を活用した研究を行いました。
特に、ヘブライ語、アラビア語、英語という三つの言語が混在する膨大な回答データの集約と分析が課題でした。プライバシーへの配慮も大切にしつつ、意見を要約するプロセスでは、BERTopicを利用してトピックモデリングを行い、さまざまな角度から学生の意見を把握しています。
また、次世代言語モデルを用いた独自の要約法により、多くの学生が共有する意見だけでなく、個々の貴重な洞察も見逃しません。学生からのフィードバックを活かし、Madrasaが提供する教育経験をさらに向上させるための一歩を踏み出しました。
出典 : Case-Study: Multilingual LLM for Questionnaire Summarization https://towardsdatascience.com/case-study-multilingual-llm-for-questionnaire-summarization-edf7acdcb37c