AIと著作権のQ&A - AIモデルの盗用問題：モデル抽出攻撃の技術的側面と著作権・不正競争法の論点

AIモデルの盗用問題：モデル抽出攻撃の技術的側面と著作権・不正競争法の論点

Tags: AI, 著作権, 不正競争防止法, モデル抽出, セキュリティ

AIモデルは、開発に多大なコストと労力がかかる一方で、一度構築されれば大きな価値を生み出します。特に高度な判断能力を持つモデルは、企業の競争力の源泉となり得ます。しかし、その価値ゆえに、AIモデルの不正な複製や利用が深刻な問題となっています。中でも、「モデル抽出（Model Extraction）」と呼ばれる攻撃手法は、モデル自体に直接アクセスすることなく、外部からのクエリとその応答のみを利用してオリジナルのモデルを模倣したサロゲートモデルを構築するという点で、従来のソフトウェア不正コピーとは異なる技術的課題を提示しています。

本稿では、このモデル抽出攻撃の技術的な仕組みを解説し、それが既存の著作権法や不正競争防止法といった法規制の下でどのように評価されうるのか、そして開発者が考慮すべき対策について考察します。技術的な視点から、AIモデルの保護における法と技術の交差点を探ります。

モデル抽出攻撃の技術的原理

モデル抽出攻撃は、攻撃者が対象となるAIモデルの内部構造やパラメータに直接アクセスできない「ブラックボックス」環境において行われることが一般的です。攻撃者は、公開されているAPIやインターフェースを通じて対象モデルに大量のクエリ（入力）を送信し、その応答（出力）を収集します。収集された「入力-出力ペア」のデータセットを用いて、攻撃者は独自のAIモデル、すなわちサロゲートモデルを学習させます。十分なデータと適切なモデルアーキテクチャを選択すれば、サロゲートモデルは元のモデルと非常に類似した振る舞いを示す、つまり「抽出された」モデルとして機能するようになります。

この攻撃は、特に以下のような技術的な側面に基づいています。

推論結果の模倣可能性: 多くのAIモデルは、特定の入力に対して確率的な推論結果やクラスラベルを出力します。攻撃者はこれらの出力を観測し、その統計的なパターンを学習することで、元のモデルの決定境界や応答特性を再現しようと試みます。
データ効率性: 高度なモデル抽出攻撃手法では、必ずしも元のモデルの学習データ全体を知る必要はありません。巧妙に設計されたクエリや、元のモデルが出力する信頼度スコアなどの追加情報を利用することで、比較的少量のクエリから効率的に学習データを生成し、精度の高いサロゲートモデルを構築することが報告されています。
アーキテクチャ情報の利用: ブラックボックス攻撃であっても、対象モデルが使用している一般的なアーキテクチャ（例: Transformer, CNN）に関する情報が公開されている場合、攻撃者はその情報を利用してサロゲートモデルのアーキテクチャを設計することができ、抽出の成功率や精度を高めることが可能となります。

モデル抽出攻撃が成功すると、攻撃者は元のモデルと同等またはそれに近い機能を持つモデルを、正規のライセンス費用や開発コストをかけずに手に入れることができます。これは、モデル提供者にとって経済的な損失だけでなく、モデルの知的財産権や競争優位性を侵害する行為となります。

モデル抽出と著作権法の論点

AIモデルの著作物性や、モデル抽出行為が著作権侵害にあたるか否かは、各国の著作権法の解釈に依存し、現在のところ明確な判例が確立されているとは言い難い状況です。しかし、いくつかの論点が考えられます。

AIモデルの著作物性:
- AIモデルは、プログラムとして保護される可能性があります。モデルのコード自体はもちろんのこと、学習済みのパラメータも、特定の構造と組み合わされることで、プログラムの一部またはそれに準ずるものとして扱われる可能性が議論されています。
- 学習データとの関連性から、データベースの著作物として保護される可能性も考えられます。ただし、モデル抽出はデータそのものではなく、モデルの「機能」や「振る舞い」を模倣することに主眼があるため、データベース著作権での保護には限界があるかもしれません。
モデル抽出行為と侵害:
- 複製権/翻案権: モデル抽出によって構築されたサロゲートモデルが、元のモデルの内部構造（例えばパラメータ値やレイヤー構造）を実質的に複製または翻案していると評価できるかどうかが争点となります。ブラックボックス攻撃の場合、直接的なコードやパラメータのコピーは行われませんが、元のモデルの持つ特徴量空間の写像や決定ロジックを再現している点が、翻案と見なされる可能性も否定できません。ただし、この評価には高度な技術的分析が必要となります。
- 公衆送信権: APIを通じてモデルを利用させる行為は公衆送信に該当し得ますが、モデル抽出はAPIの正規利用の一環として行われることが多いため、この点での直接的な侵害構成は難しい場合が多いでしょう。

著作権法による保護は、表現の類似性に焦点を当てます。モデル抽出が著作権侵害と認められるためには、抽出されたサロゲートモデルが、元のモデルの「表現」として保護されるべき部分を実質的に類似の形で再現していることを立証する必要があり、これは技術的な観点から非常に困難な課題を含んでいます。単に「似たような出力が得られる」だけでは、アイデアと表現の二分論により、著作権侵害とはなりにくいと考えられます。

モデル抽出と不正競争防止法の論点

著作権法での保護が難しい場合でも、不正競争防止法による保護が期待できる場合があります。不正競争防止法は、企業の競争上の利益を保護することを目的としており、AIモデルもその対象となり得ます。

営業秘密としての保護:
- AIモデルは、その学習済みパラメータやアーキテクチャ、学習プロセスなどが「営業秘密」として保護される可能性があります。営業秘密として認められるためには、「秘密として管理されていること（秘密管理性）」「事業活動に有用な技術情報であること（有用性）」「公然と知られていないこと（非公知性）」という要件を満たす必要があります。特に秘密管理性については、モデルへのアクセス制限や利用規約による制限が重要となります。
- モデル抽出攻撃は、この営業秘密を「不正に取得する行為」（例: 詐欺、脅迫、不正な手段によるアクセス）に該当するかどうかが論点となります。APIの正規利用の範疇であっても、その利用方法が本来想定されていない、営業秘密の侵害を目的としたものであると評価されれば、不正取得行為と見なされる可能性も考えられます。
技術的保護手段回避規制:
- 不正競争防止法は、技術的保護手段（例: アクセス制御、コピーガード）を回避する行為を規制しています。もしモデル提供者がモデル抽出を防ぐための技術的な対策（例: クエリに対する応答にノイズを付加する、異常なクエリパターンを検知・ブロックする）を講じており、モデル抽出攻撃者がそれを回避して抽出を行った場合、この規制に抵触する可能性が考えられます。

不正競争防止法による保護は、モデルの「機能」や「情報そのもの」の不正な取得や利用に焦点を当てることが可能です。そのため、著作権法よりもモデル抽出攻撃に対する保護手段として有効に機能する可能性があります。ただし、営業秘密性の立証や、攻撃行為が「不正取得」に該当するかどうかの判断には、やはり技術的な詳細な分析が不可欠となります。

技術と法解釈の交差点：今後の課題

モデル抽出攻撃のような新しい形態の不正利用は、技術的な巧妙さと法的評価の間のギャップを浮き彫りにしています。

類似性の技術的評価: サロゲートモデルが元のモデルと「どの程度」類似していれば、著作権侵害や不正競争防止法上の違法行為と見なされるのか。この「類似性」の評価は、モデルの性能比較、アーキテクチャの類似度、学習データからの乖離度など、技術的な指標を用いて行う必要がありますが、これらの技術的評価をどのように法的な基準に落とし込むかが課題です。
攻撃意図の評価: モデル抽出攻撃は、表面上は正規のAPI利用に見える場合があります。その行為が「不正」であると評価するためには、攻撃者の意図（例: モデルの複製、競争優位性の侵害）や、行為態様（例: 通常考えられない大量のクエリ発行）を立証する必要があります。
技術的対策と法的保護: モデル提供者が講じる技術的な保護対策（例: モデルに対する電子透かしの埋め込み）が、将来的な法的紛争においてどのように証拠として機能するのか、あるいは技術的保護手段回避規制の対象となる「技術的保護手段」の範囲をどのように定めるのかも重要な論点です。

開発者が考慮すべき対策

AIモデルの開発者や提供者は、法的な保護が確立されていない現状において、技術的な対策と契約による対策を組み合わせることが重要です。

技術的対策:
- クエリ監視・レート制限: 不自然な大量クエリや特定パターンのクエリを検知し、制限またはブロックするシステムを構築します。
- 応答へのノイズ付加: 推論結果に微量のノイズや不確実性を意図的に付加することで、抽出されるサロゲートモデルの精度を低下させます。
- モデルの複雑化・難読化: モデルのアーキテクチャやパラメータを推測しにくくする技術を検討します。
- ウォーターマーキング: モデルのパラメータや推論結果に識別可能な情報を埋め込み、抽出されたモデルの追跡を可能にする研究が進められています。
契約による対策:
- API利用規約: APIの利用目的を明確に限定し、モデルの複製や抽出を目的とした利用を明確に禁止する条項を設けます。違反時の損害賠償やアカウント停止などの措置を規定します。
- 秘密保持契約（NDA）: モデルの構造やパラメータに関する情報を共有する場合に締結します。

これらの対策は、単独では完全な防御とならない場合でも、攻撃コストを高め、不正行為を抑止する効果が期待できます。また、万が一紛争となった場合に、秘密管理性や技術的保護手段の存在を立証する上での重要な根拠となり得ます。

結論

AIモデルのモデル抽出攻撃は、AI技術の進化に伴って顕在化した新しい形態の不正利用です。その技術的な性質ゆえに、著作権法のような既存の法規制による直接的な保護は容易ではなく、不正競争防止法による保護の可能性も存在しますが、技術と法解釈の間の調整が不可欠です。

AIモデルの開発者や利用者は、法的な枠組みが整備されるのを待つだけでなく、モデル抽出攻撃の技術的な仕組みを理解し、技術的な防御策や契約による対策を積極的に講じることが求められます。AIモデルの健全な開発と利用を促進するためには、技術と法、そして倫理が連携し、新しい課題に対して継続的に対応していく姿勢が重要となります。