自分だけのGPTモデルを構築する動機は複数あります。大企業が各々カスタムモデルを構築している中で、独立性を確保し、コスト削減を果たすためです。私は、なぜ自分もそれができないのかと考え、実際に手を動かしてみました。
オープンソースのツールを使ってローカルで動作するLarge Language Model(LLM)を構築。その第一歩としてLLaMA.cppのインストール、Hugging Faceからのプリトレーニング済みモデルのダウンロード、そしてローカルでの実行について解説します。
また、インタラクティブにモデルを使い、チャットジーピーティーのような対話形式のAIアシスタントを目指しました。チャットテンプレートの重要性も学びました。テンプレートによってAIの挙動が大きく変わること、そしてそれがユーザー体験にどう影響するかを実際の会話形式の例を通じて説明します。
成功した部分と課題も明らかにし、自分のデータでモデルを更新したり、特定のユースケースに合わせて微調整する方法の検討など、次に進むステップについても触れます。
出典 : If big companies can build their own GPT Models… Why can’t I? https://medium.com/@shamiani/if-big-companies-can-build-their-own-gpt-models-why-cant-i-bc1e395460ee