DUICUO

IBM のオープンソース CodeFlare フレームワークは、マルチクラウド プラットフォームで実行される AI モデルに使用されます。

IBMは、ハイブリッドクラウドにおけるビッグデータと人工知能(AI)ワークフローの統合と効率的なスケーリングを簡素化するために設計されたオープンソースフレームワーク「CodeFlare」を発表しました。紹介文によると、CodeFlareは、機械学習アプリケーション向けの新興オープンソース分散コンピューティングフレームワークであるRayをベースに構築されています。CodeFlareは、特定の要素を追加することでRayの機能を拡張し、ワークフローのスケーリングを容易にします。

[[410431]]

IBMは、データと機械学習分析がほぼすべての業界に浸透するにつれて、タスクがますます複雑になっていると指摘しています。AI研究のために大規模なデータセットとより多くのシステムを設計することは重要ですが、ワークフローの数が増えるにつれて、研究者はデータサイエンスの実行よりもセットアップの設定にますます多くの時間を費やしています。

機械学習モデルの作成は現在、労働集約的な作業です。研究者は、データのクリーニング、特徴抽出、モデルの最適化といった作業を含む、これらのモデルのトレーニングと最適化を行う必要があります。CodeFlareは、このプロセスを簡素化します。Pythonベースのプログラミング言語インターフェースを使用してパイプラインを作成することで、データの統合、並列化、共有を容易にします。CodeFlareフレームワークの目標は、データサイエンティストが新しいワークフロー言語を習得することなく、複数のプラットフォーム間でパイプラインワークフローを統合することです。

CodeFlareパイプラインは、新しいIBM Cloud Code Engine(サーバーレス・プラットフォーム)やRed Hat OpenShiftなど、あらゆるクラウド・インフラストラクチャにデプロイできます。CodeFlareはイベントトリガー用のアダプターも提供しているため、パイプラインは他のクラウドネイティブ・エコシステムと統合・連携できます。さらに、クラウド・オブジェクト・ストレージ、データレイク、分散ファイルシステムなど、さまざまなソースからのデータの読み込みとパーティション分割もサポートしています。

CodeFlare により、開発者は作業を繰り返す必要がなくなり、過去の同僚がパイプラインを実行するためにどのような作業を行ったかを把握するのに苦労する必要もなくなります。「CodeFlare の目標は、データサイエンティストに、より一貫性を持って使用できる豊富なツールと API を提供することです。これにより、複雑な設定やデプロイメントに煩わされることなく、実際の研究に集中できるようになります。」

IBMは、このフレームワークによって、ハイブリッドクラウドへのデプロイメント用パイプラインの作成にかかる開発者の時間と労力を大幅に削減できることを期待していると述べています。例えば、あるユーザーは、機械学習モデルのトレーニングにCodeFlareフレームワークを使用し、10万本のパイプラインを分析・最適化した結果、各パイプラインの実行時間を4時間から15分に短縮することに成功しました。

詳細は公式ブログをご覧ください。

この記事はOSCHINAから転載したものです。

記事タイトル: IBM、マルチクラウドプラットフォームで動作するAIモデル向けCodeFlareフレームワークをオープンソース化

この記事のアドレス: https://www.oschina.net/news/149690/ibm-open-sources-codeflare