生成AIを評価する~ベンチマークテストとは~
目次 導入 ベンチマークによる評価方法 ベンチマークによる性能の数値化 まとめ 1.導入 大規模言語モデルブームの火付け役であるChat GPTの登場から数年がたち、競い合うように様々な企業が生成AIの開発を行い、今ではかなりの数の高性能な大規模言語モデル(LLM)が登場しています。Chat GPT4o、Claude3.5Sonnet、Llama3などどれも高性能でもはやどれを使っていいかわかりま…
最新NEWS
AIデザイナーがファッションショーの主役に? 東京ファッションショー
暗闇の中、水滴がゆっくりと落ちる音がスピーカーから流れる。奥から奇抜なドレスを身にまとった女性モデルがランウェーを歩く。東京大学の・・・発作が起きる兆候をAIが予測。患者の状態
心電図のデータをもとに心房細動を早期に発見する「AI診断支援システム」。いち早く心房細動に気づけるように・・・。犯罪防止に大活躍。犯罪率が激減、AI警察が進化
全米有数の犯罪多発都市で近年、銃撃事件の件数が激減している。「銃撃検出システム」を警察が導入することで・・・
さらに見る ▶︎
Googleの最新AIモデル「Gemini 2.5」徹底解説:進化と活用可能性に迫る
目次: 導入 Gemini2.5は2.0からどれだけ進化したのか? Gemini2.5の特徴 性能評…
























