「Qwen-2.5」完全解説:多言語対応・コード特化・数学特化モデルが無料で商用利用可能!
2024年11月18日、アリババクラウドは最新の大規模言語モデル(LLM)である Qwen-2.5 Turbo を発表しました。このモデルは、1Mトークンという業界トップクラスのコンテキスト長を実現し…
DimensionXが可能にする単一画像からの高精度な3D・4Dシーン生成
目次: 導入 開発背景 構造概要 応用可能性と課題 まとめ 参考文献 1.導入 近年、人工知能とコンピュータビジョンの分野では、単一の画像から高品質な3Dおよび4Dシーンを生成する技術が…
音声生成AIの最前線:Google DeepMindの最新技術
1.はじめに 本記事では、Google DeepMindによって開発されている、音声生成AI技術についてご紹介します。近年の生成AIの進化は著しく、特にテキスト生成AIは多くの人々に浸透し、日々の業務…
NotebookLMとは?無料でできる情報整理とデータ活用術
NotebookLMは、Googleが開発した情報整理と文書作成支援のためのAIツールです。2023年夏に発表され、2024年6月には最新のAIモデルであるGemini 1.5 Proとの連携で提供が…
次世代の多機能型画像生成AI~OmniGen~
目次: 導入 OmniGenの機能 性能評価 利用方法 まとめ 参考文献 1.導入 Chat GPTを皮切りに起こった生成AIブームを経て、いまや生成AIもテキストのみでなく様々なものを自然言語入力か…