Appleが発表した新しいオープンソース技術「Recurrent Drafter(ReDrafter)」は、大規模言語モデル(LLM)の推論を高速化することに成功しました。
この技術は、再帰型ニューラルネットワークと動的ツリーアテンションを組み合わせており、従来の方法と比べトークン生成効率を大幅に向上させています。
Nvidiaとの連携により、Nvidia GPU上での性能が最適化され、遅延の減少や運用コスト、電力消費の低減が実現。将来的には他のGPUへの適用も検討されているそうです。
AI技術の効率化が、リアルタイムアプリケーションのスムーズな運用を支え、今後のAI応用範囲を拡大する鍵となるでしょう。
出典 : AppleとNvidia、AI推論を高速化するReDrafter技術を共同展開 | Gadget Hack https://tech-gadget.reinforz.co.jp/13614