オープンソースソリューションのSwechaは、IIITハイデラバード、Ozonotelと提携して、大学生インターンを利用した独自のLarge Language Model(LLM)開発プロジェクトを始めました。
このプロジェクトは、「サマー・オブ・AIインターンシップ」として実施され、大量のデータに基づく言語モデルの開発を目指していますが、特にインドの言語であるテルグ語に焦点を当てています。
インドではまだそのようなインド言語を対象としたLLMは存在せず、多くのインド言語が、開発に必要なデータが少ない「低リソース言語」とみなされているため、チャレンジングな作業です。
インターンとして参加する工学部二年生の学生たちは、村や町で人々にインタビューを行い、文化や民話、歌、食べ物、歴史的な場所などに関する情報を収集します。
この取り組みにより、AIエンジニアとしての素養を身につけた学生が多数輩出され、インドの言語でのLLM開発を後押しすることが期待されています。
eczy
出典 : https://www.thehindubusinessline.com/info-tech/swecha-to-rope-in-1-lakh-engineering-students-to-build-telugu-llm-in-collaboration-with-iiit-hyderabad-and-ozonotel/article68190752.ece