DataGemma: 大規模言語モデルとデータの架け橋

１．導入

近年のAI技術の進展により、大規模言語モデル（LLM）はますます高度化し、多くのタスクに応用されています。しかし、これらのモデルが時に「ハルシネーション」と呼ばれる誤った情報を生成する問題も浮き彫りになってきました。特に、統計や数字に関連する質問に対して、不正確な回答が出ることが多いです。この問題に対処するために、GoogleはDataGemmaという新たなアプローチを開発しました。この記事ではDataGemmaとこのアプローチの研究結果を合わせて紹介します。

２．DataGemma開発の背景

DataGemmaの開発目的は、LLMが生成する情報の正確性を向上させることです。従来のLLMは膨大なテキストデータを学習する一方で、最新の統計や信頼できるデータへのアクセスが不足していました。これにより、特に統計に関する質問に対して不正確な情報が生成される可能性がありました。DataGemmaは、GoogleのData Commonsから取得した信頼性の高い統計データを使用して、LLMが生成する回答を補強し、ハルシネーションを減らすことを目指しています。

３．DataGemmaの評価

DataGemmaの評価では、主に2つのアプローチが採用されました。

Retrieval Interleaved Generation (RIG): LLMが生成した統計的な回答に対して、Data Commonsからのデータを使用して事実確認を行う方法です。RIGの結果、統計的な回答の正確性は大幅に向上し、従来のモデルが5-17%の精度であったのに対し、RIGを導入することで約58%の精度に達しました。

Retrieval Augmented Generation (RAG): ユーザーの質問に基づいて関連する統計データをData Commonsから取得し、それを基にLLMが最終的な回答を生成する方法です。この方法では、統計に基づく正確な回答が99%以上であることが確認されましたが、推論に基づく回答では76%程度の正確性にとどまることがありました。

４．今後の課題と応用可能性

DataGemmaは、AIがより信頼できるデータを基に回答を生成するための画期的なステップですが、いくつかの課題も残されています。特に、Data Commonsのデータカバレッジが限定的であるため、全ての質問に対してデータが返されるわけではなく、現時点では24-29%の質問に対してしか統計データが提供されていません。また、Data Commonsインターフェースの精度向上や、関連するデータセットの拡充が求められています。

応用面では、DataGemmaの技術は政策立案者や研究者にとって非常に有用です。例えば、経済、健康、環境などの分野における正確な統計データを基にした意思決定をサポートすることが期待されています。また、AI技術を用いたレポート作成やデータ分析にも応用でき、幅広い分野で活用が進むと予想されます。

５．まとめ

DataGemmaは、LLMが信頼性の高いデータに基づいて回答を生成するための重要な技術的進歩です。特に、統計データに基づく事実確認を行うことで、誤情報の生成を抑制し、より正確で信頼性の高い回答を提供することが可能となりました。今後の課題としては、Data Commonsのデータカバレッジの向上や、より複雑なクエリに対する対応が求められますが、その応用可能性は非常に高く、幅広い分野での活躍が期待されています。

参考文献

DataGemma: AI open models connecting LLMs to Google’s Data Commons (blog.google)

DataGemma-FullPaper (datacommons.org)

Tokkyo.Ai機能のご案内