著作権を守る技術の進展!インペリアル・カレッジ・ロンドンの研究者が開発

2024.08.01

WorkWonders

インペリアル・カレッジ・ロンドンの研究者たちは、大規模言語モデル(LLM)のトレーニングに使われるテキストや画像などのデータの著作権を守る新しい技術を提示しました。
彼らは、20世紀の地図作成者が使用した技法にヒントを得て、「著作権の罠」と呼ばれる独特な架空の文を元のテキストに埋め込むことで、トレーニング済みのLLM内でコンテンツの使用を検出できることを発見しました。

この技術は、フランスのチームと連携して、本物の効率的な言語モデルを使い、実際に「著作権の罠」をトレーニングセットに挿入して試験した結果、成功を収めました。
コンテンツの所有者は、文書集合に複数回「著作権の罠」を繰り返すことで、モデル開発者がデータをスクレイピングしてLLMをトレーニングした場合に、モデルの出力における不規則性を観察することでトレーニングを行った証拠を突き止めることができます。

開発者がトラップを取り除く技術を開発して検出を避ける可能性もありますが、この提案は著作権者やクリエーターの利益分配における透明性を高め、LLMトレーニングの過程をより公正にするための重要なステップとなるでしょう。

出典 : Phantom data could show copyright holders if their work is in AI training data https://techxplore.com/news/2024-07-phantom-copyright-holders-ai.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

【お知らせ】
弊社ワークワンダース社主催の【無料】ウェビナーのご案内です。

ウェビナー画像

経営者/管理職のため30分でわかる「生成AIはじめの一歩」ショートセミナー【無料】


【登壇者】
安達裕哉(ワークワンダース代表取締役社長)

【日時】
2025年3月18日(火) 15:30~16:00 + 質疑応答

【募集人数】
30名

【参加費】
無料

【セミナーの内容】

1. 生成AIの利活用についての日本の現状
生成AIは世界中で可能性が模索されていますが、日本ではまだ利活用が限定的です。 日本企業は新技術の導入に対し慎重な傾向があります。

2. 何に使える?生成AI
生成AIは、新しいデータや情報を生成する能力を持っています。 企業の生産性向上に寄与する7つの主要な活用方法について解説します。

3. 生成AIの導入手続き
生成AIの導入にあたり、目的設定・課題評価・パイロットプロジェクト実施・ 社内展開・従業員教育の重要ポイントを解説します。

質疑応答
生成AIに関する疑問や不安を解消するために、参加者からの質問を受け付けます。

ご参加は以下のリンクからお申込みください。
▶ ウェビナーお申込みページはこちら