秘密計算とは|その仕組みから活用事例までわかりやすく解説

昨今、多くの企業がビッグデータの事業への活用を進めており、その経済的価値が強調されています。しかしその一方で、不正なデータの売買やハッキングによるデータの漏洩といった問題が生じており、プライバシーがないがしろにされているという批判も受けています。 

こうした状況下で今、プライバシー保護のための強力な技術として、秘密計算が注目を集めています。秘密計算を活用することで、データを秘密の状態で利用することができます。例えば、個人情報を知らない状態で統計解析結果を得ることが可能となるのです。そのため、秘密計算は、プライバシー侵害を回避したい企業にとって、非常に有用な技術となります。

本記事では、秘密計算の概要や仕組み、活用事例などについてわかりやすく解説します。

秘密計算とは

秘密計算( Secure Computing )とは、簡単に言うと、暗号化された状態で計算を行う技術のことです。従来のデータ解析では、統計処理や機械学習などの解析アルゴリズムを用いて、生データを直接分析していました。これに対して、秘密計算では、生データではなく、暗号化された状態のデータを対象として解析を行います。しかも、従来と同じ解析アルゴリズムを用いたとしても、精度を落とすことなく解析することができるのです。

秘密計算には、統計処理や機械学習などの解析時にもデータを秘匿した状態で扱えるため、セキュリティレベルが飛躍的に向上するという利点があります。従来は、機密性の高いデータであっても、これを利用する際は元の状態に復号する必要があったため、漏えいや不正利用のリスクは避けられませんでした。しかし、秘密計算を用いることによって、このリスクを回避することができます。 

秘密計算の仕組み

秘密計算には、主に「秘密分散法」と「準同型暗号方式」の二つの方式があります。  

秘密分散法   

秘密分散法とは、データを断片化し複数に分散させることで機密性を高める暗号技術です。秘密分散された複数のデータの断片(シェア)の一つひとつは無意味なデータであり、シェアの1つを盗んで中を覗いても何も分からず、そこから元のデータを推測することもできません。元のデータを復元するためには、規定数以上のシェアを集める必要があります。元のデータを秘密分散して複数のサーバーに配布し、サーバー同士が通信して計算を行い、各サーバーの計算結果を集めることで初めて元のデータを復元することができます。計算時間はそれほどかかりませんが、シェアに分割するために複数のサーバーが必要となるため、システムが複雑になり、設計や管理コストが増えるという欠点があります。 

準同型暗号方式   

準同型暗号方式とは、暗号化されたデータを対象として演算を行うことができ、しかもその結果を復号すると暗号化前のデータを演算した結果と同一となる暗号技術のことです。データの秘匿性を保ちながら、外部業者に計算を委託できるというメリットがあります。一方で、暗号化したデータが膨大になり、計算や通信に必要なコストがかさむというデメリットもあります。

秘密計算の活用事例   

以下では、秘密計算の活用事例を3つご紹介します。

プライバシー保護データ分析  

例えば、交通機関の分野では、以前から電車やタクシーの乗降データと利用者の決済データをグループ会社間で連携し、駅ビルや駅構内施設の販売促進活動や不動産戦略に活用することが計画されていまいた。しかし、このデータは個人情報に直結するため、機密性・秘匿性を確保できるかどうかが、この構想の実現に向けた障壁となっていました。そこで、秘密計算を用いることで、乗降データや決済データを暗号化したまま分析することが可能となったため、グループ会社での販売促進、旅客案内業務の改善、他社との連携など、データ活用の幅が広がりました。 

ゲノム解析  

大阪大学は、ゲノム解析システムに秘密計算を導入し、個別化治療の研究推進を目指しています。ゲノムや疾患情報は機密性が高く、その解析は躊躇されるものでした。しかし、秘密計算を用い、複数の医療・研究機関が保有するゲノム・疾患情報を秘匿性を保ったまま収集することで、ゲノム変異の頻度を解析することに成功しました。  

人工衛星

地球の周りにはたくさんの人工衛星が漂っており、数パーセントの衝突リスクがあることが知られています。しかし、人工衛星の飛行ルートは各国・各事業者の機密情報であるため、簡単に共有することはできません。そこで、この問題を解決するために、秘密計算の技術が利用されています。秘密計算を用いることで、衛星の位置や飛行経路を開示することなく、衝突の危険性を分析することが可能となります。  

秘密計算×AI  

NTTは、データを暗号化したまま一度も元に戻すことなく、標準的なディープラーニングの学習処理を行うことができる技術を世界で初めて実現しました。この技術を用いることで、企業秘密や個人のプライバシーに関わるデータをディープラーニングで利用する場合、学習や予測を行うサーバーは、データを暗号化された状態のまま処理することができます。つまり、データ提供、データ保存、学習処理、予測処理など、ディープラーニングでデータを利用するために必要なすべてのステップを暗号化した状態で行うことができるのです。 

まとめ

秘密計算の技術は、高度なデータ解析だけでなく、情報銀行やブロックチェーン上の情報授受など、プライバシー保護のための次世代の基礎的な技術として広く活用されることが想定されています。また、複雑なモデリングを扱う機械学習や深層学習などのAI分野では、実用化に向けた研究が盛んに行われています。今後はますます秘密計算の実用が広がっていくと言えるでしょう。