DUICUO

MLSQL は、新世代のオープンソース言語エコシステムの構築を目指して、正式に Byzer に改名されました。

[[441450]]

12月21日、オープンソースプロジェクトMLSQLは、Byzerへの名称変更を正式に発表しました。Byzerは、MLSQLの当初の技術ミッションである「データ+AIの低コスト展開」を堅持しつつ、よりオープンで多様な言語と製品機能を統合し、より包括的な次世代オープンソース言語エコシステムを構築していきます。同時に、新しいByzerオープンソースコミュニティが正式に設立され、コミュニティウェブサイト(https://www.byzer.org)も公開されました。皆様のお越しをお待ちしております。

まったく新しいByzerとByzerオープンソースコミュニティ

Byzerという名前は、古代中国の神話上の生き物「百則」に由来しています。百則は言葉を話し、万物の感情を理解し、精霊や神々の営みを知ることができました。Byzerが百則のように、データに「人間らしく」話せるようになることを願っています。

Byzerは、宣言型プログラミングと命令型プログラミングを組み合わせたハイブリッドプログラミング言語です。ローコードでSQLライクなプログラミングロジックと、組み込みアルゴリズムおよびプラグインを組み合わせることで、データワーカーはデータパイプラインを効率的に接続し、データのクレンジングと変換を行い、機械学習のトレーニングと予測を迅速に実行できます。Byzer言語の主要用語は次のとおりです。

  • すべてがテーブルです。
  • SQL風言語
  • 組み込みアルゴリズムとプラグイン
  • カスタマイズ可能、シンプル、そして強力。

Byzerコミュニティは、データ+AI分野におけるByzerプログラミング言語を中心としたオープンソース・エコシステムの構築に注力しています。その目的は、ユーザーがデータプラットフォームを低コストかつ高効率に導入し、AIエンジニアリングを完了できるよう支援し、アナリスト、エンジニア、運用担当者の生産性を向上させることです。現在、Byzerコミュニティ内のすべてのプロジェクトはApache License V2に基づいてリリースされており、コミュニティのすべての参加者がこの契約に基づいて自由に利用できます。

[[441451]]

なぜByzerが必要なのでしょうか?

ビッグデータ、人工知能、クラウドコンピューティングといった技術の急速な発展に伴い、クラウドインフラ、基本ソフトウェア、アルゴリズムモデルは着実に改善・成熟してきました。データプラットフォームの効率化に対する業界の需要は高まり、非効率的なクロスプラットフォームデータ運用は、データプラットフォームの実装やAIエンジニアリングを担うエンジニアにとって、次第に悩みの種となっています。しかし、インフラの入れ替えから始めても、よりユーザーフレンドリーなフレームワークへの移行から始めても、優秀な研究開発人材の確保から始めても、大幅な効率向上は達成できません。

プログラミング言語レベルでのイノベーションこそが、データプラットフォームの実装とAIエンジニアリングの効率を根本的に向上させる鍵だと私たちは考えています。ローコード・オープンソース・プログラミング言語であるByzerは、データ処理チェーン、AIエンジニアリングにおける複雑な操作、そしてアクセス制御を言語レベルで抽象化し、プログラミング言語の学習と習得にかかるコストを削減することで、企業の真の効率向上を支援します。

Byzer言語の設計哲学

ビジネス機能を抽象化する際には、データ処理とデータフローが情報伝達の中核を担い、データの担い手は多くの場合、2次元または多次元のデータテーブルです。SQL言語は、本質的には2次元データテーブル上に抽象化された一連のデータ操作です。Byzer言語の中核設計は「すべてがテーブルである」です。Byzer言語を通して、ユーザーがあらゆるエンティティオブジェクトを2次元テーブルに簡単に抽象化し、テーブルに基づいたデータ処理やモデルトレーニングなどの更なる操作を可能にすることを願っています。

1. シンプルで柔軟な SQL のような構文を備えた、宣言型でありながら命令型の言語設計。

言語設計レベルでは、ByzerはSQLライクな構文を用いた宣言型プログラミングアプローチを採用しており、開発者の学習と使用を容易にしています。しかし、宣言型設計は柔軟性に欠け、非常に複雑なプログラミングニーズを満たすことができません。そこでByzerは、宣言型設計と命令型プログラミングを組み合わせることで、SQLライクな構文を拡張しています。

2. クラウド ネイティブ設計により、クラウド コンピューティング能力と安価なストレージを最大限に活用します。

クラウドインフラストラクチャの成熟が進むにつれ、ユーザーは基本ソフトウェアから上位層アプリケーションまで、スケーラビリティに細心の注意を払っています。ByzerのDay1設計はクラウドネイティブであり、安価なクラウドストレージを活用するだけでなく、ネイティブ分散エンジン(Sparkエンジンとプラグイン可能なRayエンジン)を通じてクラウドコンピューティングのパワーを最大限に活用できます。

3. 1 つの言語、1 つのエンジンでデータと AI 機能をカバーし、すぐに使用できます。

企業は、データプラットフォームやAIプロジェクトの導入において、適切なソリューションの選択に苦労することがよくあります。データエンジニアにとって、これはデータ処理チェーン全体のすべてのコンポーネントを理解、学習、開発、保守する作業を意味し、結果として学習コストと保守コストが高額になります。Byzerは、データチェーン全体をカバーする単一の言語とエンジンを提供することを目指しており、同時に、様々なアルゴリズムやモデルトレーニングのためのすぐに使用できる機能も提供します。

Byzerは12月15日にByzerバージョン2.2.0を正式リリースしました。ぜひお試しいただき、フィードバックをお寄せください。

IDE サポート - Byzer ノートブック

Byzer言語は、IDEやテキストエディタをサポートし、コードのハイライト表示、コードサジェスト、実行といった機能を提供する必要があります。現在、主流のエディタやIDEがLSPプロトコルに基づいて関連機能を実装できるように、言語サーバプロトコル(LSP)を実装することが一般的なアプローチです。ByzerはLSPプロトコルを実装し、コードサジェストAPIを提供することで、ユーザーが独自のエディタプラグインを開発してByzer開発をサポートできるようにしています。

Byzer Notebookは、Kyligenceによって開発され、コミュニティに貢献しているByzerベースのWeb IDEです。主な特徴は次のとおりです。

  • 強力なインタラクティブなコンパイル機能を誇り、コードの強調表示やコード補完などの機能をサポートしています。
  • 安定した信頼性の高いデータ エンジニアリング機能を提供し、複数のデータ ソースからのテーブル入出力と AI モデルのトレーニングおよび展開をサポートします。
  • ノートブックおよびワークフロー形式をサポートし、ユーザーにローコードのインタラクティブなプログラミング機能を提供します。

Byzer Notebook に加えて、コミュニティは Byzer 言語用の VSCode プラグインも開発しており、ユーザーは VSCode 内で Byzer コードを記述して実行できます。

Byzerは12月15日にByzer Notebookのバージョン1.0.0を正式リリースしました。ぜひお試しいただき、フィードバックをお寄せください。

ぜひコミュニティの構築にご参加くださいますようお願い申し上げます。

急成長中のオープンソースコミュニティであるByzerコミュニティは、皆様の参加と貢献を心より歓迎いたします。Byzerはすでに多くの本番環境のお客様を獲得しており、Byzerを選択したデータチームは、データプラットフォーム全体をサポートするために、少数の開発者のみを必要とします。詳細については、ByzerコミュニティのMeetupイベントや公式WeChatアカウントをフォローしてください。

コードへの貢献に加えて、コミュニティでは機能リクエストの提出、ドキュメントやビデオチュートリアルの投稿、ブログの執筆、講師としての活動、コミュニティミートアップへの参加など、様々な形での参加を歓迎しています。詳しくは、「Byzerコミュニティへの貢献方法」をご覧ください。共にオタク的で想像力豊かなコミュニティを築いていくことを楽しみにしています。

  • コミュニティ: https://github.com/byzer-org
  • 公式サイト:https://byzer.org/home
  • ドキュメント: https://docs.byzer.org
  • ロードマップ: https://github.com/byzer-org/.github/blob/main/roadmap/2022h1.md

皆様のWeChat公式アカウントのフォローも心よりお待ちしております。