次世代AIデバイスの開発秘話:エッジで動く音声認識システム

2024.12.05

WorkWonders

数年前、私たちのチームは鳥の鳴き声を識別する分類器を作り、注目を集めました。それから時間は流れ、TinyMLの周りの興奮は変わっていません。私たちの新しいプロジェクトは、週末に開発した技術の見本としています。

Seeed Studio製のWio Terminalはマイクロコントローラーのスイスアーミーナイフで、組み込みプロジェクトやIoT応用に完璧です。このデバイスは、短い時間で音声からテキストへの変換を行うAPIを実装しました。

私たちは、オープンソースのWhisperモデルと、エッジデバイスで効率的に動作するPicoLLMモデルを使用して、ローカルで音声をテキストに変換します。このプロジェクトは、小さくてもパワフルなデバイスが私たちの命令を理解し、情報やアシスタンスを提供する未来を築くことを目指しています。次のアップデートをお楽しみに!

出典 : TinyML Meets LLM: Voice Control on the Edge https://www.hackster.io/tiny-prism-labs/tinyml-meets-llm-voice-control-on-the-edge-e1e58d

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください

↓10秒で登録できます。↓