Cohereの最新LLM「Command R+」:新たなビジネスの可能性を切り開く!

この記事では、Cohereの最新のLLMである「Command R+」を紹介していきます。

【Cohereとはどんな企業?】

Cohereは2019年に設立されたスタートアップ企業で、自然言語処理や機械学習、AIを専門としたソフトウェア開発を行っています。Cohereの本社はカナダのトロントにあります。トロントはカナダの主要都市であり、オンタリオ州の州都でもあります。Cohereは、アメリカのサンフランシスコやニューヨーク、イギリスのロンドンなどにも拠点を置いています。設立者はAidan Gomezという方で、”Attention Is All You Need”という研究論文の共同執筆者でした。この論文で紹介された「Transformer」というAIアーキテクチャは、現在のほとんどのLLMに用いられており、生成AIの発展に大きく貢献してきました。

ここでCohereのこれまでの主要な製品をひとつ紹介します。

・Command R

Command Rは2024年3月15日に公開された、会話や長文のタスクに最適化された大規模言語モデル(LLM)です。特徴のひとつとしては、RAG (Retrieval-Augmented Generation)という検索拡張生成を使用できるという点です。RAGを使用することで、多くの生成AIで見られる「幻覚」を大幅に軽減することができます。また、プライベートな情報を独自に検索させ、その情報をもとに新たな応答を生成できるようになります。もうひとつの特徴は多言語に対応している点です。グローバルビジネスの主要な10言語として、英語、フランス語、スペイン語、イタリア語、ドイツ語、ポルトガル語、日本語、韓国語、アラビア語、中国語に優れています。

Command R: Retrieval-Augmented Generation at Production Scale

この他にも、101言語に対応している「Aya」というLLMや、ビジネスに活用しやすいように調整するといったサービスも提供しています。

そして2024年4月4日に新しいLLMが公開されました。それが、「Command R+」です。

 

【Command R+とは】

Command R+は、実際の企業での活用ができるような拡張性のあるLLMです。Command R+はCommand Rとほとんど同じなのですが、次のような特徴が挙げられます。

  1. Advanced RAG用に最適化されている。
  2. 英語、日本語を含む10言語に対応している。
  3. 高度なビジネスプロセスを自動化するためのツールの使用ができる。
  4. 最大で128,000トークンのContext windowに対応している。

それぞれの特徴について紹介します。

1.Advanced RAG用に最適化

以前のモデルのCommand RもRAGを使用できましたが、Command R+は高度なRAGを使用できると言われています。Command R+は応答の精度の向上、幻覚を軽減するための引用を提供しています。この機能は、ビジネスの様々な場面において、最も関連性の高い情報を素早く検索するのに役立ちます。

2.10言語への対応

Command Rと同様に10言語に対応しており、グローバルに展開する企業でも安心して導入できそうです。翻訳の能力に優れていて、これまでのLLMの中でもトップクラスです。高精度に対応している10言語は英語、フランス語、スペイン語、イタリア語、ドイツ語、ポルトガル語、日本語、韓国語、アラビア語、中国語になります。

下の図は多言語におけるタスクの処理能力を比較したものになります。左から順に、Command R+、Claude 3 Sonnet、Mistral-Large、GPT-4 Turboとなっています。GPT-4 Turboをはじめとした最先端のLLMと比較してみても引けを取らない結果となっています。特に左から2番目のFLoRES(他言語→英語)という翻訳タスクでは、最も優れた結果を残しています。

 

[出典:Introducing Command R+: A Scalable LLM Built for Business;https://txt.cohere.com/command-r-plus-microsoft-azure/

3.ツールの使用

大規模言語モデルをビジネスで本格的に利用するには、テキストの入力と生成だけではなく、言語モデル自身が意思決定を行い、ツールを使用して、様々なタスクを自動化するというところまで展開する必要があります。Command R+にはツール使用機能がついており、これにより複雑な処理が必要なワークフロー(仕事や業務の流れのこと)を自動化することができます。

4.最大128,000トークンのContext window

そもそもContext windowとは、モデルが回答を生成する際に読み込む入力データのトークン数のことです。Context windowが大きいほど、長い文章を読み込んで翻訳や要約などを行うことができるようになります。英語の場合、基本的には1単語が1トークンに当たりますが、日本語の場合はひらがなやカタカナ、漢字があるため、1文字につき1~3トークンと幅があります。したがって、一概に128,000トークンが小説本の何ページ分に該当する、などといった表現は困難です。

【まとめ】

この記事では、発表されたばかりのCommand R+を紹介しました。

  • Command R+は、Command Rから性能が向上したビジネス利用向けのLLM
  • RAGを用いた幻覚の軽減や、ツールの使用による業務の自動化が可能

Cohereは今後も自然言語処理技術の発展に欠かせない企業となりそうです。

「Command R+」の続編記事にもご期待ください!

【参考文献】

Introducing Command R+: A Scalable LLM Built for Business