マサチューセッツ工科大学のリンカーン研究所は、協力型カードゲーム「HANABI」を用いた研究により、AI(人工知能)とチームになり協力してゲームをするとフラストレーションがたまると感じる人が多いということを明らかにしました。
HANABIとは
人工知能はこれまでチェスや囲碁などの様々なゲームにおいて人間を凌駕してきましたが、人との共同作業には課題があることが今回の研究で判明しました。研究に用いたカードゲーム「HANABI」は大人数で遊ぶソリティアのようなもので、プレイヤーは協力し同じ組のカードを順番に並べていきます。ただ、プレイヤーは自分のカードを見ることができず、チームメイトのカードのみ見ることができます。そこでプレイヤーは、チームメイトのカードの情報をルールに基づいた形でチームメイトに伝えながらゲームを進行していきます。
実験と結果
研究者たちは高度に訓練されたAIを用意し、被験者にAIエージェントをチームメイトにした場合と、ルールベースのエージェント(あらかじめ定義されたルールに基づきプレイするように手動でプログラムされたボット)をチームメイトにした場合の2回のゲームをシングルブラインド形式で行わせました。
研究者たちは高度に訓練されたAIを用意し、被験者にAIエージェントをチームメイトにした場合と、ルールベースのエージェント(あらかじめ定義されたルールに基づきプレイするように手動でプログラムされたボット)をチームメイトにした場合の2回のゲームをシングルブラインド形式で行わせました。
その結果、AIがチームメイトの場合とルールベースエージェントがチームメイトの場合でスコアはささほど変わらなかったにもかかわらず、多くの被験者はAIとチームを組むことに不快感を示しました。被験者はAIのチームメイトに対して、予測不可能で信頼できず、たとえいいスコアを取れたとしてもネガティブな感情を抱くと述べました。
この研究には強化学習*により高度に訓練されたAIが用いられており、これまで一度も共にプレイしていないAI同士のペアで事前にゲームをしたところ、未知のAIエージェント同士のHANABIプレイとしては過去最高のスコアを達成したため、人間とペアを組ませても素晴らしいプレイをするだろうと研究者たちは予想していました。そのため、この研究結果は研究者たちを大いに驚かせました。AIとルールベースのエージェントのスコアに統計的な差は存在せず、29人の被験者全員がルールベースエージェントの方が好きだと答えたのです。
この研究をまとめた論文は、2021 Conference on Neural Information Processing Systems (NeurIPS)に採択されています*。人間がAIとのチーミングを嫌うことは、将来AIと共にミサイル防衛や複雑な手術などに取り組む際の大きな懸念となるでしょう。
*強化学習について詳しく知りたい方は、↓の関連記事をご参照ください。
関連記事:強化学習とは―概念や仕組み・機械学習との違いを解説
人の及ばぬAIの創造性
ある被験者は、ルールベースのエージェントは下手であったがチームとしては機能していた一方、AIエージェントに関しては、ルールは理解しているものの、その動きはチームとしてのまとまりを欠いていたと述べました。
AIが悪いプレーをするという認識は、研究者が強化学習の研究で観察してきたAIの驚くべき行動と合致しています。2016年にDeepMind社のAlphaGoが世界最高の棋士の一人に勝利した際、AIが途中で打った奇抜な手を人間の解説者たちはミスだと考えましたが、勝利した後その手が非常に計算されていたものであることがわかり、天才と評されました。しかし、このような手が人間とチームを組んでいる際に評価される可能性は低いでしょう。
リンカーン研究所の研究者たちは、チームにおける奇妙な動きや一見非論理的な動きは、AIのチームメイトである人間の信頼を壊す最悪の要因であることを発見しました。このような動きは、自分とAIのチームメイトがどれだけうまく連携しているかという認識を低下させるだけでなく、AIと一緒に仕事をしたいと思う気持ちも低下させます。
論文の共著者であり、人工知能技術グループの研究者であるロス・アレン氏は、数字を改善するAIの開発に取り組むのは簡単である一方、人間の主観的好みに合わせたAIを開発するのは非常に困難だと述べています。リンカーン研究所の技術局が資金提供をしており、米空軍人工知能加速器とMIT電気工学・コンピュータサイエンス学科との共同研究である、MeRLin(Mission-Ready Reinforcement Learning)プロジェクトはこの困難な問題の解決に取り組み研究を進めています。