ワシントン大学、コペンハーゲン大学、スタンフォード大学の研究者によると、OpenAIの人工知能モデルが著作権で保護された作品をトレーニングデータとして使用している可能性が高いことが示唆されました。
特に珍しい単語を正確に予測できる能力が、著作権で保護された小説などの内容を「記憶」している証拠となっています。
研究チームは、AIモデルの内部を探る新しい手法を用い、問題のデータについてより透明性が求められると指摘しています。
ちなみにOpenAIは、著作権侵害に関する訴訟に直面する一方で、AIトレーニングのための「フェアユース」を成文化すべく政府に働きかけをしています。
この問題は、AI開発の透明性や著作権との兼ね合いに焦点を当てることで、今後のAI業界に大きな影響を及ぼすことでしょう。
出典 : OpenAI GPT-4が著作権コンテンツを”暗記”していた – 新研究が明らかにする衝撃の事実 – イノベトピア https://innovatopia.jp/ai/ai-news/50971/