Red Hatは、「Red Hat Summit 2025」にて、AI推論を効率的に高速化するための新技術「vLLM」と、オープンソースプロジェクト「llm-d」を発表しました。vLLMはGPUのメモリ管理を効率化させ、
多くのリクエストに対応するための手法を導入しています。これにより、処理速度の向上を目指しています。また、llm-dを通じて、推論処理を複数のサーバや環境に分散し、効率的な大規模処理を可能にします。
大手企業が参画するこのプロジェクトは、より速く、使いやすい生成AIのための道を切り開くものです。
出典 : Red HatがAI推論の高速化、効率化でvLLM基盤と新OSSプロジェクト「llm-d」を発表 https://atmarkit.itmedia.co.jp/ait/articles/2505/22/news099.html