かつてのアプリケーション開発では全ての論理を一つの大きなサービスに詰め込む「モノリス」が主流でしたが、効率的なクラスタ管理技術の進歩により、それをより小さな「マイクロサービス」として分割し、別々に構成・スケールする方法が取られるようになりました。同じ進化のパターンが、Small Language Models(SLMs)と呼ばれる言語モデルの分野でも見られます。
LLMs(Large Language Models)はAIの万能薬ではなかったと気づいた今、SLMsへの注目が高まっています。エンタープライズAIの専門家、Keith Pijanowski氏は、このトレンドを予見し、分散しスケールするSLMsの重要性を説いています。
たとえば、より小さなSLMsは特定のタスクを効果的に実行するために、LLMsを圧縮し、目的に沿って微調整します。これにより、必要に応じてリソースの使用をスケールアップ・ダウンできます。
将来的には、SLMsが組み込まれた新たな「エージェンティックAI」が全業界に利益をもたらすことになるでしょう。SLMsは、一つのGPUに収まるサイズであるべきという考え方が、効率よくAI/MLを進化させることに寄与するキーポイントなのです。
出典 : MinIO goes big on Small Language Models https://www.techzine.eu/blogs/data-management/130377/minio-goes-big-on-small-language-models/