AI技術はここ数年で急速に進化し、特に自然言語処理(NLP)分野における成果は目覚ましいものがあります。この進化から得たヒントを元に、物理現象の理解を目的としたAIモデルがArchetype AIの研究チームによって開発されました。このモデルは、従来の物理法則に基づくアプローチとは異なり、現象論的な視点から物理現象を学習・予測することを目的としています。今回の記事では、この「現象論的AI基盤モデル」による物理信号の理解に関する最新の研究について、分かりやすく紹介します。
目次
1.現象論的AIモデルの概要とその革新性
この研究では、物理現象の解析に基づくAIモデルを構築しています。具体的には、約5.9億件の実験データを使ってAIモデルを訓練し、物理的な現象を効率的にエンコードし、予測する能力を持つモデルを開発しました。このモデルのユニークな点は、物理法則や保存則のような「強い帰納的バイアス」を一切学習させなかったことです。その代わりに、現実世界の実験データを直接学習することで、さまざまな物理現象を幅広く理解し、予測する能力を獲得しています。このことを「現象論的」あるいは「現象学的」と呼んでおり、英語では” Phenomenological”と訳されます。現象論的なアプローチでは、現象の背景にある因果関係ではなく、現象の表面的な部分に注目します。
このアプローチは、自然言語処理の分野において統一的なモデル(例えばGPT-3やGPT-4のような大規模言語モデル)が、個々の専門的なモデル(例えば、翻訳特化モデルなど)を上回る成果を上げたことに着想を得たもので、物理現象の分野にも同様の手法を適用できるかどうかを検証しています。具体的には、従来の物理法則などに基づいて複雑な計算処理を行うモデルと異なり、データ自体の特性に基づく現象論的なアプローチを採用することで、より広範な現象の解析を可能にしている点に革新性があると言えます。
2.現象論的アプローチの利点
従来、物理現象を扱うAIモデルは、保存則や方程式などといった物理法則を事前に学習させて開発されてきました。こうしたモデルは、その領域においては強力である一方で、未知の現象や異なる条件に対応するのが難しいという課題がありました。一方、現象論的なアプローチを採用したAIモデルでは、特定の物理法則を学習せずとも、膨大なデータを通じて物理現象を理解することが可能です。しかし、この手法にはデータ収集の困難さや、センサーの特性に対する敏感さなどの課題も残されています。
この研究では、そうした課題に対する一つの解決策として、センサーで得られた多様な物理量を統合的に扱うことで、より普遍的な物理現象の理解を目指しました。例えば、電流や温度、回転速度などの物理量をセンサーから取得し、それらを統合してモデルを訓練することで、物理的な過程をデータに基づいて予測する仕組みを構築しています。
3.現象論的AIモデルの構築と学習手法
今回開発されたモデルの特徴の一つは、Transformerベースのエンコーダーを用いている点です。エンコーダーは、センサーから取得された物理データを埋め込みベクトルとして表現し、その後にデコーダーが過去のデータの再構築、および未来のデータの予測を行います。このデコーダーには現象論的なアプローチを適用しており、未来の測定値を予測する関数「g+」と過去の測定値を再構成する関数「g-」が用いられています。
図1 現象論的AIモデルの構造
このモデルの訓練には、河川の流量や太陽光発電量、降水量など、41の公開データセットから得られた物理測定値が使用されました。訓練データは合計で5億件以上にも及び、これにより多様な物理現象をカバーしています。訓練は教師なし学習の形式で行われ、過去と未来を同時に出力する並列処理構造にとなっています。
4.物理的システムを用いた実験とその結果
このモデルの有効性を検証するために、二つの物理的なシステムに対する実験が行われました。一つは力学的な振動子の系、もう一つは熱力学系です。
4.1 力学モデル
まず、力学的な振動子に関する実験では、振動開始直後にカオス的な挙動を示しながら、その後、調和振動に落ち着いていく様子が観測できます。この実験の予測モデルでは、様々な段階(カオス状態、移行期、減衰振動など)における結果を予測させました。結果として、減衰振動に近づくにつれて予測性能が向上し、平均二乗誤差(MSE)は0.0013まで低下しました。
図2 力学系の実験装置図と実験結果
4.2 熱力学モデル
次に、熱力学系においては、ゼーベック効果に基づく実験を行いました。ゼーベック効果とは、温度の差から電圧が生じる現象のことであり、そのときに流れる電流を記録しました。この実験では、40分間の記録をいくつものウィンドウに分割し、制限された区間のデータからその後の電流値の挙動の予測精度を測定しました。結果として、多くの場合において予測誤差は非常に小さくなりましたが、一部のデータでは周期的なパターンへの依存や高周波ノイズの影響で予測が困難なケースも見られました。
図3 熱力学系の実験装置図と実験結果
5.現実世界での応用可能性と評価
このモデルの可能性をさらに評価するために、現実世界の観測データに対する予測も行われました。具体的には、メルボルンの最低気温、トルコ全土の電力消費量、中国のある州における変圧器の油温など、複数のデータセットに対して過去の測定値の再構成および未来の予測を行いました。その結果、ゼロショット(新たなデータに対して追加学習を行わない)でのモデルは、特定の訓練モデルを上回る成果を示し、平均で34%の誤差改善を達成しました。下の図4は過去のデータの再構築の例を表しており、オレンジの凡例が再構築結果となっています。図5~7は、未来のデータを予測した実験結果を示しており、緑のデータを入力した後にオレンジの予測を出力しています。なお、青色の凡例は実測値を表しています。
図4 トルコ全土のエネルギー消費量(過去のデータの再構築)
図5 トルコ全土のエネルギー消費量(未来予測)
図6 変圧器の油温予測
図7 水蒸気濃度の予測
さらに、現実世界での複雑な事象に対するAIモデルの予測精度を以下の図8に示しています。青色の棒グラフは専門的なタスクに特化して学習されたモデルを表し、赤色の棒グラフはゼロショットによる予測モデルを表しています。このグラフでは、縦軸の誤差(MSE)が小さい方が予測精度が高いことを表しています。
図8 異なるモデルの予測精度
6.まとめと今後の展望
今回紹介した現象論的AI基盤モデルは、従来の物理法則に基づくモデルを超える可能性を示しました。保存則などのような物理法則を事前に与えず、純粋にデータから学習することで、未知の物理現象に対する柔軟な予測が可能となり、これが新たな物理信号解析のアプローチとして期待されています。
しかし、今後解決すべき課題も残されています。例えば、サンプリング周波数の違いがモデルの性能に及ぼす影響や、非周期的な信号に対する予測精度の向上などが挙げられます。また、デコーダーの設計をさらに改善することで、モデルの予測能力を向上させることが期待されています。
物理現象の理解を目指すこの研究は、従来のAI技術を物理学に応用する新しい可能性を拓くものであり、今後も多くの分野での応用が期待されます。物理学の世界では、方程式が立てられない問題や、解が見つからない問題がいくつも存在します。こうした複雑な問題に対して、AI技術を活用することで複雑な現象を予測する試みは、AIが未知の領域を切り拓くための重要な一歩となるでしょう。