開発者も知っておきたいAIの法律トラブル回避方法

AIに係る法律を理解するためにはAI自体の理解が欠かせません。そこでAIはどんなプロセスで生成されるのかは知りつつ、どの過程で法的問題が発生するのかという手順で見ていきたいと思います。そもそもAIとは、データ収集モデル学習という2つのプロセスを経て作成されます。そうして作成されたものは学習済みモデルと呼ばれ、これを使用してさまざまな生成物を生成していきます。

データ収集

データ収集においては、AIの目的に応じて必要なデータ(元データ)を収集し、学習用データセットを作成します。しかし、元データ及びデータセットは法律により保護されている場合が少なくありません。そこで、その法律とデータの関係を見ていきたいと思います。

著作権法

まず、著作権法は「(1)思想又は感情を(2)創作的に(3)表現したものであって、(4)文芸、学術、美術又は音楽の範囲に属するもの」を「著作物」(著作権法2条1項1号)として保護しています。ゆえに、事実データ(統計データなど)は(1)及び(2)の要件を満たさないため、著作権法により保護されない可能性が高いですが、文章・絵画・音楽・写真のデータ保護の対象となる可能性があります。学習用データセットは元データを選別・加工する過程で創作性が生まれると同法の保護の対象となりえます。また、平成30年の著作権法改正により、著作権法30条の4が変わりました。改正により「著作物に表現された思想又は感情の享受を目的としない利用」であれば、著作者の承諾なしに著作物を利用することが可能となりました。それにより、AI開発のために著作物を学習用データとしてデータベースに記録することが可能です。また、収集したデータをAI開発の範囲内であれば、第三者に提供することもできます。なお、旧47条の7では「統計的」な情報解析のために著作物を利用することが許容されていましたが、改正により、「統計的」という制約がなくなり、情報解析のためならば広く著作物を利用することができるようになりました。具体的には、深層学習のような統計的手法ではない利用のためであっても、他人の著作物を学習用データとして扱えるようになりました。

不正競争防止法

秘密として管理されている事業活動に有用な技術上又は営業上の情報であって,公然と知られていないものを「営業秘密」(不正競争防止法2条6項)として保護しています。営業秘密には、(1)秘密管理性,(2)有用性,(3)非公知性の3つの要件があり、これを満たせば学習データも保護の対象となりえます。一方、(1)秘密管理性が保持されていない、スマホの位置情報データなどの第三者への提供を前提に一定の条件下で使用できるデータも「限定提供データ」として同様に保護の対象となります。

特許法

特許法は,特許発明として物の発明,方法の発明並びに物を生産する方法の発明を保護します(特許法2条3項1~3号)。ここで「物」の発明とは「プログラム等」も含み(2条4項)、「データ構造」「構造を有するデータ」も「プログラムに準ずるもの」として「発明」に該当します。すなわち学習用データセットがAIの動作を規定している場合は保護の対象となりえます。

個人情報保護法

個人情報保護法は①個人識別符号が含まれるもの(顔認識データなど)、②当該情報に含まれる氏名,生年月日その他の記述等により特定の個人を識別することができるものという2つの要件のうちどちらかを満たすものを「個人情報」として保護します。また、個人情報は取得に関しても制限があります。医療データなどの重要な情報を含むデータは「要配慮個人情報」(個人情報保護法2条3項)として本人の同意なしには取得できないことになっています。それ以外の個人情報であってもその利用目的をできる限り特定した上,原則として,その取得に際して個人情報の対象者本人に利用目的を通知・公表又は明示し,その目的の達成に必要な範囲で取り扱わなければなりません(個人情報保護法15条,16条1項,18条1項,2項)。さらに、個人情報データベース等を構成する個人情報である個人データは、データベースに保存されているという特性から漏洩の危険性が高く、取り扱いに際して「データ内容の正確性の保持」、「安全管理措置」、「従業者の監督」、「第三者への提供の制限」など規制が多くなっています。このように個人情報は規制が多く扱いづらいデータといえます。ここで役に立つのが「匿名加工」です。個人情報であっても個人を識別できない状態に加工すれば、幅広いデータの活用が可能となります。

電気通信事業法

電気通信事業法は「電気通信事業者の取扱中に係る通信の秘密は,侵してはならない」(電気通信事業法4条1項)と規定し,「通信の秘密」を保護しています。LINEのやり取りや無線LANのアクセスポイントから外部と通信を行うことで把握されるスマホの位置情報データなどはこの通信の秘密にあたり、保護されます。こうしたデータをAI開発に利用する際には通信当事者より許可を得る必要があります。

モデル学習

学習に必要なデータを集めたならば、次は機械学習などの様々な手法を用いてAIにデータを学習させていきます。その際にもプログラムが必要となります。そのプログラムを学習用プログラムと呼び、これ対する法的保護も存在します。

著作権法と不正競争防止法

上述した要件を満たせば、学習用プログラムも保護の対象となりえます。

特許法

上述したようにさきほどの条件を満たすプログラムは発明と認められるため、学習用プログラムもその条件を満たせば、保護の対象となります。

学習済みモデル

著作権法

このようにして生成されるのが学習済みモデルです。学習済みモデルは学習済みパラメータが組み込まれた「推論プログラム」でありますが、学習済みパラメータは学習用データセットを学習用プログラムに読み込ませることで生成されるものでありますから、人の思想または感情の表現とはいえず,著作物性はないとする意見もあります。ゆえにAIを著作物と認めてもらうには、学習用データセットをただAIに与えるのみならず,どのように前処理するか,どのようにAIを学習させ,どの程度学習させるかといった創意工夫が重要となります。一方で、推論プログラムについてはモデル学習の議論が参考になります。

不正競争防止法

同法は「秘密管理性」「有用性」「非公知性」の3つの要件を満たせば、営業秘密としてあらゆるデータを保護してくれます。一方、データを不正に取得するなどの不正行為を規制しているにすぎず、プログラムを解析し、そこから製造方法や動作原理、設計図などの仕様やソースコードなどを調べるリバースエンジニアリングを規制していません。

特許法

学習済みパラメータが組み込まれた「推論プログラム」であるため、学習済みモデルは上述した条件を満たすプログラムであれば発明と認められ、保護の対象となります。

AIの生成物

著作権法と特許法

同法は,2 条 1 項 1 号において「思想又は感情」の創作的表現のみが著作物に該当するとしており,自然人(人間)の創作物でなければ著作物としての保護を与えていません。ゆえにAIによる生成物は思想・感情という要件を満たさないため,著作物には該当しません。同じく特許法においても発明の主体がAIとなる場合は、特許法の要件である自然人に合致せず、保護の対象となりません。しかしAIの生成物を生み出す過程において、学習済みモデルの利用者に創作意図があり、同時に、創作的寄与があれば、利用者が思想感情を創作的に表現するための道具としてAIを使用して当該AI生成物を生み出したものと考えられ、保護の対象となりえます。一方、イギリスの法律ではコンピュータによる生成物に対しても著作権を与えています。しかし、著作者はそのプログラムを書いた人となっています。

不正競争防止法

市場に提供されることで一定の価値(ブランド価値など)が生じたAI創作物については、不正競争防止法の商品等表示の保護にあたるとされています。