Meta社のLLaMA3: 高性能な大規模言語モデルの特徴と展望
米メタ(旧フェイスブック)が2024年4月18日に大規模言語モデル(LLM)であるLLaMA3(ラマ3)を発表しました。今回の発表では、8B(80億)および70B(700億)のパラメータを持つ2つのモ…
Phi-3:小さなモデルで大きな飛躍を ~Microsoftの新戦略~
Microsoftは米国時間の4月23日に、新しい「小さな言語モデル」Phi-3シリーズを発表しました。MicrosoftはこれまでにもPhiシリーズをいくつか発表しており、今回はその最新版となります…
Cohereの最新LLM「Command R+」:新たなビジネスの可能性を切り開く!
この記事では、Cohereの最新のLLMである「Command R+」を紹介していきます。 【Cohereとはどんな企業?】 Cohereは2019年に設立されたスタートアップ企業で、自然言語処理や機…
GPT-1:OpenAIの言語モデル、生成AIへの第一歩
みなさんはChatGPTを利用したことがあるでしょうか?ChatGPTは、私たちの質問に対して、まるで人間が答えているかのような回答をくれます。この技術の正体が大規模言語モデル(Large Langu…
PaLM:Passwaysによる高速学習の実力とは!?
この記事では、Googleが2022年に発表したPaLMを紹介していきます。 【GoogleのPaLMとは】 PaLMはGoogleが2022年4月5日に論文を公開した大規模言語モデルです。このモデル…