無料の日本語特化LLMの使用感

近年のAI(人工知能)の進化はめざましく、そのなかでもLLM(大規模言語モデル)の進化はChat GPTを筆頭に注目を集めています。

世界中でLLMの開発が進む中、日本企業や日本の大学は日本語対応に特化したLLMの開発に力を入れ始めています。

この記事ではそのようなLLMのうちだれでも無料で利用できるものを実際に使用した結果を比較します。

1.日本語特化LLMの種類

日本語に特化したLLMは以下のような種類があります。

  • Tsuzumi

NTTが開発、軽量だが高い日本語処理能力を持つ。

  • ELYZA-japanese-Llama-2-70b

東京大学松尾研究室発のAIカンパニーであるELYZAが日本語特化LLMを発表した。

700億パラメータをもち、Meta社のオープンソース基盤モデル「Liama270B」

をベースとして開発された。

  • Swallow 13B

Swallowは東工大と産総研の研究チームによって開発された日本語LLM。

ベースはMeta社のLlama2で、2023年12月の時点では最高水準の日本語能力を示している。

  • Cotomi

NECが開発 130億パラメータをもつ 軽量化により標準的なサーバーでも動作可能

このほかにも様々な日本語処理能力を高めたLLMが開発されています。

しかし無料で使用できるものは多くなく、今回はELYZA-japanese-Llama-2-70bを実際に使用し、日本語特化ではないGPT3.5、Claude2.1と比較しようと思います。

2.比較内容

    • 与えられたテーマに沿って違和感のない日本語の文章を生成できるか
    • 英語のテキストを日本語に訳したとき違和感のない日本語になっているか
    • 日本語独自の表現(スラング、ことわざなど)の意味を正確に把握しているか

まず、①で使用するテーマは「未来の医療技術が人々の健康や医療システムに与える影響について500字で考察してください」です。

②で使用する英語のテキストは

“After being told by her cardiologist that her arrhythmia and shortness of breath were symptoms of congestive heart failure which would require vigorous treatment with IV medications, Mary knew she would have to tighten her belt financially to pay for the costly American healthcare system despite having insurance – a harsh reality that made her regret not having moved to Canada where she could’ve had her condition treated by their publicly-funded universal healthcare like her cousin who had received a coronary artery bypass graft last year without paying out-of-pocket costs which were causing Mary to miss the boat on investing for retirement.”

この一文に含まれる要素は以下の通りです:

・慣用句: “tighten her belt”, “miss the boat”

・複雑な構文: 多重の関係節、挿入節が複数ある複合文

・文化的背景: アメリカとカナダの医療制度の違い

・専門用語: “arrhythmia”, “congestive heart failure”, “coronary artery bypass graft”

・多義性: “belt”(財布の革ひもと、ベルト地帯の2つの意味)

最後に③で使用することわざ、慣用句は

「やぶさかではない」

「役不足」

「檄を飛ばす」

「忸怩たる思い」

「他山の石」

「天上天下唯我独尊」

「確信犯」

「他力本願」

「斜に構える」

などの誤用が多いものの意味を問い、答えを比較します。

3.出力結果

    • の結果は以下のようになりました。
・Chat GPT(3.5)

未来の医療技術が人々の健康や医療システムに与える影響は非常に大きいと考えられます。まず第一に、進化する医療技術は診断や治療の精度を向上させることが期待されます。例えば、遺伝子療法や再生医療の発展により、個々の遺伝子プロファイルに基づいたカスタマイズされた治療法が実現される可能性があります。これによって、疾患の早期発見や効果的な治療が可能となり、健康状態の改善が期待されます。

また、AI(人工知能)や機械学習の導入により、医療データの解析や診断の効率化が進むことが見込まれます。これによって、医師や医療従事者はより正確で迅速な判断を下し、患者に適切な治療を提供できるようになります。さらに、テレメディシンや遠隔医療の発展によって、地理的な制約を超えて医療サービスを利用できるようになり、医療格差の縮小にも寄与すると期待されます。

一方で、これらの医療技術の進歩はいくつかの課題も抱えています。例えば、個人情報や医療データの保護が重要な課題となります。また、高度な技術を利用した医療はコストがかかる場合があり、社会的なアクセスの問題や負担増加の懸念があります。さらに、人間性や医療の人間味を失わないようにするためにも、技術と人間のバランスが重要です。

総じて、未来の医療技術の発展は医療の質や効率性を向上させる一方で、倫理的・社会的な課題にも対応しながら、より持続可能で包括的な医療システムの構築が求められると考えられます。

フォームの始まり

・Claude2.1

近年、医療技術の急速な進歩により、人々の健康増進と医療システムの向上が期待されています。AI(人工知能)や遺伝子編集技術、再生医療などの先端技術は、未来の医療を大きく変革する可能性を秘めています。

AI医療は、膨大なデータと高度な解析力を駆使し、的確な診断と最適な治療を可能にします。また、ウェアラブル端末から収集されるリアルタイムの生体データを活用し、疾病の早期発見や予防医療の実現が期待できます。遺伝子編集技術は、がんや難病の原因となる遺伝子を編集することで、根治を目指せるでしょう。そして再生医療により、失われた組織や臓器を再生させ、移植に頼らずに機能回復が図れる可能性があります。

一方で、高額な医療費の問題や、倫理的な課題も指摘されています。AIやゲノム編集技術が万能ではなく、人間の専門的判断が重要となります。また、個人の遺伝的素因に基づくオーダーメイド医療の実現により、医療格差の問題が生じかねません。適切な規制と社会制度の構築が求められます。

このように、未来の医療技術には光と影の両面があり、人々に多くの恩恵をもたらす一方で、新たな課題にも直面することが予想されます。健康で質の高い生活を実現するには、先端技術と人間の英知を適切に組み合わせた賢明な運用が不可欠となるでしょう。

・ELYZA

未来の医療技術の発展が人々の健康や医療システムに与える影響について考察すると、以下のような変化が予想されます。

  1. 予防医療の進化: 遺伝子検査やバイオセンシング技術の発展により、病気の早期発見だけでなく、病気の予防が可能になるでしょう。個人の遺伝子情報に基づいたパーソナライズド医療が実現し、病気になりにくい体づくりができるようになります。
  2. 個人に最適化された治療: 遺伝子検査やバイオセンシング技術の発展により、個人の体質や遺伝子に基づいた最適な治療方法を選択できるようになります。また、3Dプリンティング技術の進化により、人工内耳や人工骨など、個人に合わせて作製された人工器官が実現し、より高い治療効果が期待できます。
  3. 医療アクセスの改善: 遠隔医療やロボット手術などの技術の発展により、地理的な問題や医師不足の問題が解消され、世界中の誰もが質の高い医療を受けられるようになるでしょう。
  4. 医療コストの削減: 予防医療の進化により、病気になる人が減少することで、医療費の削減につながる可能性があります。また、医療ロボットやAIの活用により、医師の負担が減り、医療現場の効率が向上することで、医療コストの削減につながる可能性があります。

以上が未来の医療技術が人々の健康や医療システムに与える影響についての考察です。これらの技術は人々の健康に大きなメリットをもたらす可能性がありますが、個人情報の扱いや医療格差の問題など、新たな課題も生じる可能性があります。

フォームの始まり

これらの結果をみると、GPT3.5には所々日本語として読みづらい箇所があり、また文章として不自然な部分が見られます。(「基づいたカスタマイズされた…」など)

Claude2.1の結果ではあまり日常的には見られない表現がいくつか使われています。

(「根治」、「素因」など)

ELYZAで生成した文章ではそのような細かい違和感はありませんでした。

続いて②の結果は以下のようになりました。

・Chat GPT3.5

心臓専門医から、不整脈と息切れがうっ血性心不全の症状であり、IV薬物治療による激しい治療が必要とされると告げられた後、メアリーは保険に加入しているにもかかわらず、高額なアメリカの医療制度の費用を支払うために経済的に苦しむ必要があることを悟りました。この厳しい現実は、カナダに移住していれば、従兄弟が去年冠動脈バイパス手術を受け、自己負担費用がかからなかった公的に資金提供されるユニバーサルヘルスケアで自身の状態を治療できたであろうことを後悔させました。この自己負担費用がメアリーに退職のための投資を逃す原因となっています。

・Claude2.1

循環器科医から、不整脈と呼吸困難は心不全の症状であり、点滴治療が必要になると告げられた後、メアリーは高額な米国の医療費を支払うために財布の紐を締めなければならないことを知った。保険に加入していたにもかかわらずこのような厳しい現実に直面し、カナダに移住していれば、従弟のように公的医療制度で冠状動脈バイパス手術を受けられ、自己負担なしで済んだはずだと後悔した。このような出費は、メアリーが老後の投資に遅れをとる要因となっていた。

・ELYZA

医師から、不整脈と呼吸困難は、強力な治療が必要な心不全の症状であると告げられたマリーは、高額な医療費を支払うために、厳しい現実であるアメリカの健康保険制度による医療を受けなければならないことを知りました。保険があっても自己負担の医療費が高額で、財政的に厳しくなることを余儀なくされました。カナダに移住していれば、公立のユニバーサルヘルスケアで無償の医療を受けることができたのにと、マリーは後悔しました。マリーのいとこは昨年、自己負担金なく、冠状動脈バイパス移植を受けていました。マリーは、老後のための投資をすることができないことに、不安を感じていました。

この結果を見比べると、3つすべての結果において誤訳や解釈ミスはないようです。

しかし日本語の文としてみたときにはClaude2.1の出力が最も簡潔にまとまっているように見えます。

最後に③の結果を見てみましょう。

・Chat GPT3.5

もちろんです。それぞれの慣用句の意味を説明しますね。

  1. やぶさかではない: 「やぶさか」とは物事が確実であることを指します。この慣用句は、「やぶさかである」の否定形であり、何かを疑ったり信じなかったりすることを意味します。つまり、「確かではない」という意味です。
  2. 役不足: 「役」とは役割や利益、効果などを指し、「不足」は足りないことを表します。したがって、「役不足」とは期待された役割や効果が得られないことを指します。
  3. 檄を飛ばす: 「檄」とは鼓舞や奮起を促す言葉や合図を意味し、「飛ばす」は強く送り出すことを表します。この慣用句は、熱い言葉や指示を発して人々を奮い立たせることを指します。
  4. 忸怩たる思い: 「忸怩」とは胸騒ぎや心の葛藤を意味し、「たる」はその状態を強調する助詞です。この慣用句は、心の中で葛藤や罪悪感を感じる思いを表します。
  5. 他山の石: 「他山」は他人の失敗や誤りを指し、「石」は教訓や反省を促すものを表します。この慣用句は、他人の失敗や経験から学ぶことができるという意味です。
  6. 天上天下唯我独尊: 「天上天下」は天と地という広い範囲を表し、「唯我独尊」は自分だけが特別であるという自負や高慢を表します。この慣用句は、自分を特別だと考えて他人を見下す態度を指します。
  7. 確信犯: 「確信」は確かな信念や自信を表し、「犯」は罪や過ちを犯すことを指します。この慣用句は、自分の信念や考えを持ってかたくなに行動する人を指します。
  8. 他力本願: 「他力」は他人や外部の力を頼ることを意味し、「本願」は本来の願いや目的を表します。この慣用句は、自分の力ではなく他人や神仏に全てを任せる考え方を指します。
  9. 斜に構える: 「斜」は垂直ではないことを意味し、「構える」は姿勢や態度を表します。この慣用句は、物事に対して無関心であったり、他人と異なる態度を取ることを指します。
・Claude2.1

「やぶさかではない」: 物事に当たり障りがなく、まっすぐでさらりとしている様子。簡単すぎて面白味がない、平凡な意味も含む。

「役不足」: 役割や勤めが自分に合わず、能力以下のことをさせられていること。

「檄を飛ばす」: 戦いや運動への参加を呼びかける号令を送ること。

「忸怩たる思い」: 気恥ずかしく、おずおずとした気持ち。

「他山の石」: 他人の長所を自分の長所としてとり入れること。

「天上天下唯我独尊」: 天下に自分以外のものはなく、自分が最高だという考え方。

「確信犯」: 犯行を事前に決意し、覚悟を決めている犯罪。

「他力本願」: 自分の力だけでは無理なので、他者の力を頼りにすること。

「斜に構える」: 物事に偏った見方をし、公平を欠いた態度を取ること。

・ELYZA

それぞれの慣用句の意味について説明します。

「やぶさかではない」

– 意味: 承諾、同意

– 使用例: 「この仕事はやぶさかではないが、あなたの方が適任だ」

「役不足」

– 意味: その人の能力や格が、その役職に及ばないこと

– 使用例: 「彼は役不足で、まだ部長としての権限を十分に発揮できていない」

「檄を飛ばす」

– 意味: 威勢よく声をかけて、人を励ましたり激励したりすること

– 使用例: 「監督が檄を飛ばし、選手たちの士気を高めた」

「忸怩たる思い」

– 意味: 心の底から悔やんだり、不満に思ったりすること

– 使用例: 「彼は試合に負け、忸怩たる思いでいた」

「他山の石」

– 意味: 他人の失敗や成功から学ぶこと

– 使用例: 「他山の石として、他の人の経験を自分の糧にしよう」

「天上天下唯我独尊」

– 意味: 自分以外はすべて自分の従者であるという意味の仏教語

– 使用例: 「彼は天上天下唯我独尊の気持ちで、傍若無人に振る舞っていた」

「確信犯」

– 意味: 確信を持って行う犯罪

– 使用例: 「彼は確信犯で、自分の行動に責任を持っていた」

「他力本願」

– 意味: 他人や他の力に頼って生きていくこと

– 使用例: 「他力本願では、自分の人生を切り開いていくことはできない」

「斜に構える」

– 意味: 物事に対して斜に構えて、批判的な態度をとること

– 使用例: 「彼は斜に構えて、周囲と協力することができなかった」

「役不足」「檄を飛ばす」「忸怩たる思い」「他山の石」「天上天下唯我独尊」「確信犯」「他力本願」「斜に構える」これらの慣用句は誤用が辞書に載るほど定着してしまっているので本来の意味でなくても正しいとしましょう。

「やぶさかではない」は本来の意味である「~するのにためらわない、喜んで~する」が正確に答えられているかを見てみます。

GPT3.5とClaude2.1は意味を間違えていますが、ELYZAは間違えていませんでした。

しかし、口語表現を重要視しているのか本来の意味を答えているものはほとんどありませんでした。

4.まとめ

ELYZAを使ってみた感想ですがやはり日本語の出力の正確性は自由に使えるLLMの中でトップレベルだと感じました。

英文を日本語に翻訳するのはClaude2.のほうが得意なのかもしれませんが、日本語の文章を生成したり、要約したりする能力には長けていると思います。

これからも様々な特化型LLMが登場すると思うので、用途によって使い分けるとより

LLMを使いこなせるでしょう。

参考文献:

精選版 日本国語大辞典収録キーワード一覧 276850件目から276920件目 – コトバンク (kotobank.jp)