|
2月16日、 Open Atom Foundation主催の「 2023 Open Atom Developer Conference」において、Ant Groupが主導するグラフデータベースTuGraph、時系列データベースCeresDB 、プライバシーコンピューティングフレームワークSecretFlow 、フロントエンドフレームワークOpenSumi 、データドメイン大規模モデルオープンソースフレームワークDB -GPTが「 2023 Fast-Growing Open Source Projects」に選出された。 (画像: TuGraph、CeresDB 、SecretFlow 、Open SUMI 、DB - GPTが「2023年最も急成長しているオープンソースプロジェクト」に選出されました) Ant Groupの中核戦略は、重要な基盤ソフトウェアのオープンソース化にあると理解されています。今回選定された5つのプロジェクトは、Ant Groupの重要な基盤ソフトウェアのオープンソース化への投資が評価されたこと、そして大規模モデルを扱う業界横断的なオープンソースプロジェクトが注目を集めていることを示しており、業界が大規模モデルの応用を模索する上で刺激を与えています。 例えば、 CeresDBは時系列データを保存・管理するための分散データベースです。高性能な読み書き、高圧縮率・低コストのストレージ、そしてビジュアルクエリ機能を備えており、IoT 、運用監視、財務分析といったシナリオに適しています。CeresDBオープンソースプロジェクトの責任者であるRen Chunshao氏は、「このオープンソースによって、開発者が時系列データストレージにおける水平スケーラビリティと高可用性の課題を解決し、大規模データを扱うシナリオにおける開発効率を向上させることを期待しています」と述べています。現在、プロジェクトのカーネルであるHoraeDBはApache Software Foundationに寄贈されています。 AIと大規模モデルの台頭は、技術革新に機会と課題の両方をもたらしました。オープンソースにとって、それは新たな活力でもあります。例えば、基本ソフトウェア開発の分野では、大規模モデルとデータベースの組み合わせが新たなイノベーションを巻き起こしています。 アントグループは今年6月、データベース分野向けの大規模モデルフレームワークであるDB-GPTを発表しました。DB -GPTは、大規模モデルとデータベースを組み合わせることで、エンタープライズナレッジベース、生成レポートおよび分析システム(GBI)、日常のデータ処理とレポートなど、さまざまなアプリケーションを体系的に構築できます。DB -GPTオープンソースプロジェクトの責任者である陳法強氏は、「大規模なモデルとデータベースに基づいて、企業や開発者は少ないコードで独自のカスタマイズされたアプリケーションを構築できます。DB -GPTが大規模モデル分野のインフラストラクチャを構築し、データベースを中心とした大規模モデルアプリケーションの構築をよりシンプルで便利にすることを期待しています。」と述べています。DB -GPTは個人のプロジェクトとして始まり、わずか6か月で10,000近くのスターを持つオープンソースコミュニティに成長し、業界と開発者から認められていることがわかっています。 カンファレンスでは、いくつかの主要な技術的課題と問題点についても議論されました。AIと大規模モデルの爆発的な増加は、コンピューティングパワーへの不安をもたらし、システム効率に対する要求をより厳しくしています。大規模モデルの応用開発に関して、アントグループのAIインフラストラクチャ責任者である張克氏は、アントのAIエンジニアリングの実践を共有しました。張克氏は、アントはシステムインテリジェンスを通じて効率最適化の問題を解決し、トレーニングおよび推論エンジンフレームワーク、オンラインサービス、GPUクラスターのスケジューリングと仮想化、エンジニアリングインテリジェンスなど、複数の領域における効率改善を包括的にカバーしていると述べました。現在、分散トレーニングシステムサービスDLRoverと、このシステム内のメモリおよび転送最適化ライブラリGLakeはオープンソースです。 張克氏はまた、アント・ファイナンシャルが1万キロワット以上のコンピューティングパワーを持つ異機種混合クラスターを構築し、 1,000キロワット以上のコンピューティングパワーでトレーニングコンピューティング効率(HFU)が60%以上に達したことを紹介した。実効トレーニング時間は総トレーニング時間の95%以上を占める。RLHFトレーニングは、同じモデル性能下で、業界ソリューションと比較してトレーニングスループットを3.59倍、推論性能を約2倍向上させ、業界の先進レベルに位置付けられている。「現在、この技術力はアント・ファイナンシャルのBailing大規模モデルに適用されており、より環境に優しく効率的なコンピューティングパワーをもたらすだろう」と張克氏は強調した。 (写真:Ant Groupの張克氏がAIエンジニアリングの実践について語る) この会議において、アントグループは「情報とデータセキュリティの最前線」に関するサブフォーラムも主催し、国内外の専門家が大規模モデルのプライバシー保護、データセキュリティ、量子暗号といったテーマについて議論しました。アントグループが主導しオープンソース化された「Copper Lock」プロジェクトでは、暗号研究、商用暗号アプリケーションの促進、エコシステム構築に特化したプロジェクト管理委員会が設立されました。 |