OpenAIが取得した最新の特許US12051205B1は、大規模言語モデルを活用した革新的なシステムに関するもので、ユーザーが質問をすると、AIが画像上で正確な位置を指し示して答えを提供します。
例えば、画像内で「赤い花はどこ?」と質問した際に、AIが子犬の後ろを指して「ここにあります」と回答する機能です。
以前にも画面の特定位置について説明する技術が特許として出されていましたが、今回の特許はその応用範囲をさらに広げたものです。
一見シンプルなこの技術は、特許の審査過程での進歩性の問題をクリアし、新たな可能性を秘めています。
画像とテキスト情報の融合によって、AIの利便性がさらに向上することが期待されます。
出典 : OpenAIの特許を分析する(9):OpenAIが力を入れる画像系AIとLLMの融合特許(栗原潔) – エキスパート https://news.yahoo.co.jp/expert/articles/79127e37a56542be02da080eb71822e07c7611f5