|
10月27日、海外メディアは、人工知能(AI)企業Jina AIが第2世代テキスト埋め込みモデル「Jina-embeddings-v2」のリリースを発表したと報じました。このオープンソースモデルは、コンテキスト長8K(8192トークン)をサポートし、大規模テキスト埋め込み(MTEB)のリーダーボードと機能において、OpenAIの独自モデルtext-embedding-ad-002と直接競合することが可能です。 注目すべきは、jina-embedding-v2 が分類平均、並べ替え平均、検索平均、要約平均の点で OpenAI を上回ったことです。 jina-embeddings-v2は、徹底的な研究開発、データ収集、そして微調整を経て、ゼロから丹念に構築されました。その結果、前バージョンと比較して飛躍的な進歩を遂げたモデルが誕生しました。 jina-embeddings-v2の8Kコンテキスト長は、技術的な成果にとどまらず、法務文書分析、医療研究、文学分析、金融予測、会話型AIなど、幅広い業界アプリケーションに新たな可能性をもたらします。ベンチマークテストでは、この拡張コンテキストにより、jina-embeddings-v2は複数のデータセットにおいて他の主要なベースエンベディングモデルよりも優れた性能を発揮することが示されており、より長いコンテキスト機能の実用的な利点が強調されています。 Jina AIは、「Jina-embeddings-v2」の技術的な複雑さとベンチマークを詳述した学術論文を発表し、OpenAIと同様の組み込みAPIプラットフォームを開発し、ドイツ・イギリスモデルを立ち上げる予定です。 |