自分だけのLLMモデルを調整する方法とは? 前回の記事で、独自にLLMをトレーニングする利点をお話しました。今回は、実際のチューニング方法と必要なコードをわかりやすく解説します。例えば、自然言語で尋ねられた質問をSQLクエリに変換する「Llama2–7B」モデルをチューニングします。
データベースの構造はLLMが活用する上での文脈となり、データセットを用いてチューニングを進めます。この記事は主にSQL出力のためのチューニングに焦点を当てていますが、方法論は他の目的に合わせて調整が可能です。
実際の作業では、Google Colabを使ってLLMをフィンチューニングします。OpenRAILライセンスの「know_sql」データセットと、チューニングプロセスを扱う「axolotl」フレームワークを使用します。このフレームワークは、YAML設定ファイルを変更するだけで簡単にチューニングプロセスを行うことができます。プロセスは記事に詳しく記載されていますが、不明な点はaxolotlのドキュメントも参照してください。
出典 : https://medium.com/towards-data-science/how-to-efficiently-fine-tune-your-own-open-source-llm-using-novel-techniques-code-provided-03a4e67d1b48