IBMの研究者たちは、「Breakthrough low-latency, high-energy-efficiency LLM inference performance using NorthPole」と題された技術論文を公開しました。この文書では、2024年9月に行われるIEEE高性能極限コンピューティング(HPEC)バーチャルカンファレンスで、新しいAIU NorthPole AI推論アクセラレータチップの性能結果が発表される予定です。
このチップは、30億パラメーターを持つGranite LLMに関するもので、AI推論の分野で低遅延かつ高エネルギー効率を実現するとされています。研究の要約と技術論文へのリンクは、提供されたウェブサイトで確認できます。
論文には、多数の研究者が貢献し、IBM研究機関のメールアドレスを通じて更なる情報を得ることができるでしょう。この研究が、AIの可能性を新たな次元に導く一歩と見られており、科学技術の進歩に興味がある方々にとって注目の内容です。
出典 : Novel NorthPole Architecture Enables Low-Latency, High-Energy-Efficiency LLM inference (IBM Research) https://semiengineering.com/novel-northpole-architecture-enables-low-latency-high-energy-efficiency-llm-inference-ibm-research/