目次:
- 導入
- Claudeシリーズとは
- Claude3.7 Sonnetの特徴
- 利用方法、料金
- 今後の展望
1.導入
米国のAI開発トップ企業の一つ、Anthropicは2025年2月24日、同社が開発している大規模言語モデル(LLM)であるClaudeシリーズの最新モデルにあたるClaude3.7 Sonnetを発表しました。
Anthropicはこのモデルを「これまでで最も知的なモデルであり、市場初のハイブリッド推論モデル」としており、ユーザーが瞬時の応答と拡張的な段階的思考(Extended Thinking)を一つのモデルで実現した、とのことです。
この記事ではClaude3.5 Sonnetのアップデート版モデルClaude3.7 Sonnetについて詳しく解説していきます。
2. Claudeシリーズとは
ClaudeはOpenAI出身の技術者を中心としたAI開発企業Anthropicが提供するLLMモデルのシリーズです。Chat GPT 、Geminiなどのモデルと並ぶ高性能なモデルとして知られています。また、このモデルはAnthropicの企業理念に基づいて安全性を最重要として設計されています。AIが有害なコンテンツや倫理的に不適切な内容を生成することへの規制がかなり厳しく行われています。
安全性に関しては他のモデルを大きく上回っていると言えます。
3.Claude3.7 Sonnetの特徴
Claude3.7 Sonnetの最大の特徴はAnthropicも言っている通り市場初の「ハイブリッド推論モデル」であることでしょう。
単一のモデル内で応答速度を重視した入力と深く考えることを促す入力を切り替えることができます。
また、コーディング能力が大幅に向上しており、Claude Codeというエージェントツールと連携してより実用的なコーディング支援が可能になっています。
Claude Codeはコマンドライン上でコードの検索、読み取り、編集、テスト実行、GitHubへのコミットやプッシュなどの複数のタスクを自動で実行できます。
以下はベンチマークによる性能評価です。
この表から、Extended Thinkingを使用したClaude3.7 Sonnetの性能は他社の最新推論モデル(o3-mini-highやGrok3など)と同等かそれ以上の推論能力を持っていることがわかります。特にAgentic codingとAgentic tool useはExtended Thinkingなしで既存モデルを大きく上回っています。これらは実際のソフトウェア開発を想定したタスクによるエージェント的コーディング作業の精度と、モデルが計画的にツールを呼び出しながらタスクを完了する精度を測っているベンチマークです。
また、複雑な数学などの問題を解決する能力は他のモデルに比べて少し苦手であることも分かります。
Anthropicのブログでは外部専門家との協力による安全性評価や、不要な拒否応答の削減(前モデルと比較して45%減)など、安全面での強化も強調されています。
4.利用方法、料金
Claude3.7 Sonnetは現在すべてのプランで利用可能で、Web上で登録すればだれでも利用可能です。ただ注意しなくてはならないのは、Claude3.7 SonnetのExtended Thinkingモードは有料会員しか利用できないことです。
Claudeの有料プランにはPro、Team、Enterpriseなどの種類がありますが、これらすべてでExtended Thinkingは利用可能です。
API連携も公開しており、AnthropicのAPIのほかに、Amazon Bedrock、Google CloudのVertex AIなどでも利用できます。
API料金は以下のようになっています。
・入力トークン:100万トークンあたり $3
・出力トークン(思考トークンを含む):100万トークンあたり $15
5.今後の展望
Claude Codeは実用性が示されているもののまだ実験的な段階のツールであり、今後の信頼性の向上、長時間実行コマンドのサポート、アプリ内表示の改善、モデル自身の能力理解の拡張などを継続的に改善していく予定とのことです。
Claude Codeを利用することで、人間の開発者が手作業で45分以上かかるタスクを一回のパスで自動的に完了できたという報告もあります。
2025年は「AIエージェントの年」などと言われています。今後LLMはClaude3.7 Sonnetのようにエージェントと統合して私たちの生活を便利にしてくれる方向に進化していくのかもしれません。
参考文献:
https://www.anthropic.com/news/claude-3-7-sonnet