革新的な機械学習モデルのトレーニング方法を紹介

2024.02.03

WorkWonders

先日、新しい大規模言語モデル(LLM)の微調整手法についての論文がarXivに公開されました。このアプローチは、模倣学習と強化学習のハイブリッドアルゴリズムを使用しており、

PPOや教師あり学習アプローチの代替手段として利用できるシンプルかつ効果的な方法です。

この手法では、従来の教師あり学習における問題点を解決します。例えば、従来の教師あり学習は、大量のトレーニングデータから単語のログ確率を最大化することによりパラメータを訓練しますが、分散の不一致という問題があります。一方で、模倣学習手法では、参照となるLLMの指導のもと、模擬データを自身で生成する訓練を行います。

新たなフレームワークでは異なる「ロールイン」と「ロールアウト」の方法を選択可能で、この手法の革新的な側面を研究しています。また、今後2〜3か月以内にはそのコードも公開される予定です。この斬新なトレーニング手法により、特定のタスクに適した効率の良い言語モデルの開発が可能になる見込みです。

出典 : https://medium.com/@dipendrakumarmisra/learning-to-generate-better-than-your-llm-41b9f0511ece

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

【お知らせ】
弊社ワークワンダース社主催の【無料】ウェビナーのご案内です。

ウェビナー画像

経営者/管理職のため30分でわかる「生成AIはじめの一歩」ショートセミナー【無料】


【登壇者】
安達裕哉(ワークワンダース代表取締役社長)

【日時】
2025年3月18日(火) 15:30~16:00 + 質疑応答

【募集人数】
30名

【参加費】
無料

【セミナーの内容】

1. 生成AIの利活用についての日本の現状
生成AIは世界中で可能性が模索されていますが、日本ではまだ利活用が限定的です。 日本企業は新技術の導入に対し慎重な傾向があります。

2. 何に使える?生成AI
生成AIは、新しいデータや情報を生成する能力を持っています。 企業の生産性向上に寄与する7つの主要な活用方法について解説します。

3. 生成AIの導入手続き
生成AIの導入にあたり、目的設定・課題評価・パイロットプロジェクト実施・ 社内展開・従業員教育の重要ポイントを解説します。

質疑応答
生成AIに関する疑問や不安を解消するために、参加者からの質問を受け付けます。

ご参加は以下のリンクからお申込みください。
▶ ウェビナーお申込みページはこちら