フェデレーテッドラーニング(Federated Learning)とは

フェデレーテッドラーニングとは

近年、様々な分野で機械学習が活用されており、その成果が如実に表れていることは周知のことだと思います。

一方で、機械学習は一つのクラウド上でデータを収集・分析するため、膨大な通信量負担やプライバシー侵害のリスクなどが課題として挙げられています。

さらに、エッジAIと呼ばれる、端末ごとに機械学習を用いる手法もありますが、この手法は、各端末の処理能力の低さから収集したデータを活用しきれていないという問題を抱えています。

*エッジAIについて詳しく知りたい方は、↓の参考記事をご参照ください。

こうした問題を解決する手段として2017年にGoogleが提示したのが、フェデレーテッドラーニング(Federated Learning)、すなわち連合学習です。

フェデレーテッドラーニングとは、データを一つのクラウドに集約せずに各エッジに分散した状態で機械学習を行い、各エッジから得られた改善情報をクラウド上で解析し各エッジにフィードバックする方法です。

活用事例

フェデレーテッドラーニングの具体的な活用事例をご紹介します。

スマートフォン

スマートフォンについては、以下の手順でフェデレーテッドラーニングが活用されています。

  1. 機械学習のベースモデルをスマートフォン(エッジ)に直接ダウンロードする
  2. スマートフォンを使用する中で収集されたデータを基にエッジ上で機械学習を行う
  3. 機械学習の結果から改善情報のみを抽出し暗号化(匿名化)してクラウドに送信する
  4. クラウドにおいて収集された改善情報を分析し、各エッジにフィードバックする

上記のように、エッジであるスマートフォン上で機械学習を用い、そこで得られた改善情報のみを暗号化してクラウドに送り返すことによって、通信量が最小限に抑えられ、プライバシー侵害のリスクも低減できます。

実際にGoogleが行っている事例としては、Pixel 4が挙げられます。そこでは上記で説明したように、エッジで機械学習を行った結果から改善情報のみを抽出し、他媒体の情報との掛け合わせによって改善を行っています。

例えば、Pixel 4上のタッチ操作に関係するアルゴリズムに対して、大量のエッジ(スマートフォン)から送られてくる改善情報を基にクラウド上で解析評価しました。その結果、「強く押す動作と長く押す動作の区別は、ユーザーには識別困難であることが分かったため、両者を統一的に扱うべきである」という結論を得ることに成功しています。

ヘルスケアデータ

ヘルスケアデータは、その活用が大きく期待されているデータですが、極めて慎重に取り扱う必要のある個人情報を含んでいます。というのも、病気に関するデータを収集しようとすると、個人の年齢や身長、体重といった基本的な事項から生活習慣や持病、罹患歴などの情報も収集する必要があるからです。

従来の機械学習では、収集された全てのデータが一つのクラウド上に集約されるため、ヘルスケアデータに含まれる個人情報の漏洩リスクが懸念されます。これに対して、フェデレーテッドラーニングでは、機械学習の学習結果と学習モデル更新に必要な情報のみがクラウドに送信されるため、個人情報の秘匿性を維持しつつ機械学習を進めることが可能となります。

メリット・解決できるエッジAIの課題

ここまでフェデレーテッドラーニングについて活用事例を挙げながら説明してきましたが、改めてどのようなメリットが存在し、そしてエッジAIの課題をどのようにして解決するのかについて整理します。

メリット

  1. 個々のエッジで機械学習を行い、必要な改善情報だけを抽出し暗号化した状態でクラウドに送信するため、プライバシーを保護をしつつ通信量を最小限に抑えることができる。
  2. 複数のデバイスが個々のデータをローカルかつプライベートに保ちながら、共有されたグローバルモデルを共同で学習することができる。

解決できるエッジAIの課題

エッジAIはオンデバイスで複雑な処理、機械学習が行えるようになると、端末上で機械学習に必要なデータを収集し、厳格に管理することができます。一方で、端末単位で収集したデータをクラウドで学習しないと、学習結果がいつまでたっても各端末(エッジ)に反映されないという課題が生じてしまいます。これまで述べてきたように、フェデレーテッドラーニングでは必要な情報のみを抽出してクラウド上に送り返し、その結果が反映、改善されるため、こうした課題は解決されます。

まとめ

従来の機械学習(クラウドAI)とエッジAIの双方のデメリットを補うフェデレーテッドラーニングですが、機械学習が抱える問題のすべてを解決できるわけではありません。しかし、膨大な通信量を抑えたりプライバシー侵害のリスクを低減したりと、その効果が絶大であることも事実です。スマートフォンや医療面での活用事例を挙げましたが、今後もその活用分野は拡大され、私たちにさらなる恩恵をもたらしてくれるでしょう。