|
9月8日、アントグループがバンド会議のサブフォーラムにおいて、大規模コードモデル「CodeFuse」を初めてオープンソース化し、この市場への参入を果たしたと報じられました。これは、コード作成を支援するAI製品が市場で増加している中での出来事です。 報道によると、これはAnt Groupが開発した大規模なコード生成モデルです。開発者の入力に基づいてインテリジェントな提案とリアルタイムサポートを提供し、コードの自動生成、コメントの追加、テストケースの生成、コードの修正と最適化などを支援し、研究開発の効率を向上させます。 Ant Group は、「ユーザーが初心者であっても、経験豊富な開発者であっても、CodeFuse はプログラミングの効率と精度を大幅に向上させ、誰もがプログラミングとイノベーションを実現できるようにします」と述べています。 Ant Financialの大規模基本モデルをベースに開発されたCodeFuseは、HumanEvalコード補完ベンチマークにおいて74.4%のスコアを達成し、GPT-4(67%)やWizardCoder-34Bの73.2%を上回りました。このオープンソースリリースには、コードフレームワークとモデルが含まれており、現在、関連プラットフォームで利用可能です。IT Homeユーザーは、HuggingFaceからモデルをダウンロードできます。 コードフレームワークには、自社開発のマルチタスク・ファインチューニング(MFT)フレームワークが含まれています。MFTは、コード生成、コード変換、テストケース生成、バグ修正など、数十のタスクを同時にファインチューニングできます。MFTフレームワークは、Ant Financialの自社開発モデルだけでなく、複数のオープンソースの大規模モデルのコード機能のファインチューニングをサポートします。同時に、このフレームワークには革新的なファインチューニング・データ・パッケージング技術が組み込まれており、ファインチューニング速度を約8倍向上させるとされています。また、マルチデプロイメント最適化技術を用いることで、推論速度を約2倍高速化します。 モデルコンポーネントには、CodeFuse13B-4KとCodeFuse-CodeLlaMa34B-MFTという2つの大規模モデルが含まれています。モデルのトレーニング中、CodeFuseはプログラム分析および検証技術を用いて高品質なコードデータをフィルタリングし、ドメイン固有の辞書を構築することで、平均コード長を10%以上削減しました。 Ant Groupは、CodeFuseが今年6月に早くも社内テストを開始し、実際の開発環境で使用されて、自然言語によるH5ミニゲームの作成やAlipayミニプログラムの迅速な開発など、敷居の低いプログラミングを支援することを明らかにしました。CodeFuseをベースとしたアプリケーションには、開発アシスタント、IDEプラグイン、データアナライザーなどがあり、現在の研究開発作業の主要なニーズをカバーしており、 Ant Groupの社内研究開発プロセスで徐々に検証されてきました。 |