大規模言語モデル(LLM)入門講座は、LLMについて学びたい人々のためのトピックと教育リソースを集めたものです。この講座では、対話形式のコースを提供し、個別に質問に答えたり知識を試したりするアシスタントが用意されています。
科学者コースはLLMの構築方法を学ぶことに焦点を当てています。最新の技術を使って最良のLLMを作り出す方法についてです。トランスフォーマー・アーキテクチャの詳細な知識は必須ではありませんが、トークン化によりテキストを数字に変換し、注意機構を含む層を通してこれらのトークンを処理し、さまざまなサンプリング戦略を通じて新しいテキストを生成する主要なステップを理解することは重要です。
出典 : The Large Language Model Course https://towardsdatascience.com/the-large-language-model-course-b6663cd57ceb