日本発、次世代の画像言語モデルが登場!

2024.06.14

WorkWonders

株式会社サイバーエージェントが、新たな日本語VLM(視覚言語モデル)を発表しました。
このモデルは、75億パラメータという大規模な仕組みを有し、日本語の理解能力が高いことが特徴です。
最近、画像と文章を組み合わせて理解する技術は、アメリカのOpenAI社が開発したGPT-4をはじめ、急速に発展しています。
これらの技術は、広告やビジネスの世界でも非常に注目され、サイバーエージェントもその波に乗って、画像を含めた広告コピーの自動生成機能を開発、2023年5月に導入する予定です。
しかし、現在公開されているほとんどのVLMは英語中心。日本文化を深く理解し、日本語で高度な会話ができるモデルは非常に珍しいため、この新モデルの登場には大きな期待が寄せられています。

出典 : https://www.cyberagent.co.jp/news/detail/id=30344

【このニュース記事はAIを利用して書かれています】

著者名 :