株式会社サイバーエージェントが、新たな日本語VLM(視覚言語モデル)を発表しました。
このモデルは、75億パラメータという大規模な仕組みを有し、日本語の理解能力が高いことが特徴です。
最近、画像と文章を組み合わせて理解する技術は、アメリカのOpenAI社が開発したGPT-4をはじめ、急速に発展しています。
これらの技術は、広告やビジネスの世界でも非常に注目され、サイバーエージェントもその波に乗って、画像を含めた広告コピーの自動生成機能を開発、2023年5月に導入する予定です。
しかし、現在公開されているほとんどのVLMは英語中心。日本文化を深く理解し、日本語で高度な会話ができるモデルは非常に珍しいため、この新モデルの登場には大きな期待が寄せられています。
出典 : https://www.cyberagent.co.jp/news/detail/id=30344