新しいアイデアにオープンになるオープンソース ソフトウェア ツールは、ソフトウェアとハードウェアの初期コストの低減、総所有コストの低減、ベンダー ロックイン、ライセンス管理の簡素化、アクティブなコミュニティからのサポートなど、多くの利点があるため、引き続き人気を博しています。 以下では、今年注目を集めた人気のオープンソースソフトウェア製品をいくつかご紹介します。中には、すでに広く利用されているものもあれば、比較的新しいもの(中には昨年登場したばかりのものもあり)もありますが、すでに成長の兆しを見せています。 当然のことながら、AI と生成 AI アプリケーション開発の波はオープンソース ソフトウェア採用の主な推進力であり、このリストにある製品の一部はソフトウェア開発領域に属し、AI システムに必要な膨大な量のデータを管理するニーズを満たすのに役立つ可能性があります。 これらの製品は、MITライセンス、Apache 2.0ライセンス、GNU GPLなどのオープンソースライセンスの下で使用できます。これらの製品の一部は、スタートアップアクセラレータやベンチャーキャピタルのY Combinatorから資金提供を受けたスタートアップ企業によって開発されました。 1. エアバイトAirbyteは、ETL/ELTデータパイプライン向けのデータ統合およびデータ移動プラットフォームとして急速に成長しており、アプリケーション、API、データベース、ファイルをデータウェアハウス、データレイク、その他の接続先に接続します。Airbyteは、非構造化データや半構造化データを、AIアプリケーション向けのベクターデータベースや大規模言語モデルフレームワークに移動するためにも使用できます。 AirbyteのコアであるAirbyte Open Sourceは、4万社以上の企業で利用されています。このソフトウェアは、MITライセンスやElastic License 2.0など、複数のオープンソースライセンスの下で使用できます。 サンフランシスコに本社を置くAirbyteは、このプラットフォームを基盤とした幅広い商用製品とサービスを提供しています。今年5月には、テクノロジーサービスプロバイダーや再販業者がAirbyteソフトウェアを活用できるよう、認定コースを含むパートナープログラムを開始しました。 2. ApacheデータフュージョンApache Software Foundation は、DataFusion を「データベース、データフレーム ライブラリ、機械学習、ストリーミング アプリケーションなどの高品質のデータ中心のシステムを構築するための、高速でスケーラブルなクエリ エンジン」と説明しています。 DataFusion は、埋め込み SQL エンジンとして使用することも、カスタマイズして、高スループット、低レイテンシの分析、ストリーミング、トランザクション ワークロードに重点を置いた新しいシステムを構築するための基盤として使用することもできます。 DataFusion は、Apache Arrow (列形式のデータを処理するデータ分析アプリケーションを構築するための言語に依存しないフレームワーク) と Rust プログラミング言語の技術的機能を活用します。 Apache Software Foundation は 2019 年から DataFusion の開発に取り組んでいます。今年 6 月、Apache Software Foundation は、Apache Arrow プロジェクトの一部である DataFusion が、「継続的な成長のために、よりターゲットを絞ったガバナンス機能を提供する」トップレベル プロジェクトに指定されたと発表しました。 DataFusionは、Apache Software Foundationのウェブサイト、GitHub、その他のウェブサイトからダウンロードできます。このソフトウェアはApache 2.0ライセンスに基づいており、最新のソースコードバージョンは41.0.0です。 3. 答えDanswer の Web サイトによると、Danswer はオープンソースの AI アシスタントとエンタープライズ検索アプリケーションを提供しており、企業のすべてのツール、アプリケーション、ドキュメントを接続して、組織全体で情報を見つけやすくします。 Danswerは、このソフトウェアはChatGPTと同等のものであり、自動化という幻想を抱くことなく、組織独自の情報、データ、ドキュメントにアクセスできると述べています。Danswerのソフトウェアは、SlackやGoogle Docsなど、既に40以上のターンキー統合を提供しており、「さらに日々新たな統合が構築されています」。 Danswer ソフトウェアは、エンタープライズ データ センターまたはクラウド プラットフォームで自己ホストできます。 Danswerは2023年に設立され、Y Combinatorの支援を受けています。ソフトウェアはMITライセンスに基づいており、同社およびGitHubから入手可能です。 4. ダックDBDuckDB は、オンライン分析処理 (OLAP) クエリ ワークロードをサポートするように設計された高性能のインプロセス データベースです。 Database of Databasesのウェブサイトによると、このリレーショナル(テーブル指向)データベースはSQLをサポートし、列ベクトル化されたクエリ実行エンジンを採用しています。このエンジンは、大量の値をベクトルとして単一の操作で処理することができ、データベースはホストプロセスに埋め込まれて実行されるように設計されているため、サーバーデータベースをインストールする必要がありません。 DuckDB はもともと、2018 年にオランダ国立数学・コンピューター科学研究所 (Centrum Wiskunde & Informatica) で開発されました。 DuckDBとそのコア拡張機能はMITライセンスに基づくオープンソースであり、ソースコード全体がGitHubで無料で公開されています。DuckDBバージョン1.0.0は今年6月にリリースされ、DuckDB.orgウェブサイトとGitHubから入手できます。 DuckDB がこれほど注目を集めた理由の 1 つは、スタートアップ企業の MotherDuck が DuckDB 上で動作するクラウド分析ソフトウェアを開発したことです。 5. Grafana オブザーバビリティツールGrafanaは、様々なデータソースからメトリクス、トレース、ログデータを収集・可視化するオープンソースの可観測性・データ可視化プラットフォームです。IT/OT監視システムのコンポーネントとして広く利用されています。 GrafanaはGrafana Labsによって開発され、AGPL-3.0オープンソースライセンスの下で利用可能です。同社は今年4月にGrafana 11.0をリリースしました。このバージョンには、Explore Metricsの新たな根本原因分析機能、改善された可視化機能、よりシンプルなアラート機能、そして他のデータソースのサポートが含まれています。 Grafana Labsは、主力ソフトウェアに加え、マルチテナント型ログ集約システムGrafana Loki、大規模分散トレース向けバックエンドソフトウェアGrafana Tempo、スケーラブルなバックエンドメトリックストレージおよび分析ツールGrafana Mimirなど、オープンソースソフトウェアも開発しています。Grafana Labsは、ソフトウェアの商用エンタープライズ版も販売しています。 6. ランチェーンPython.Langchain.com と IBM の Web サイトによると、LangChain は、外部データ ソースに接続する大規模な言語モデルによって駆動される生成 AI アプリケーションを開発するためのオープンソース オーケストレーション フレームワークです。 企業や組織が独自のデータを大規模言語モデルにロードする方法があれば、データの準備と大規模言語モデルの調整の複雑さ、およびデータ セキュリティの問題により困難な作業となる可能性のある生成 AI から、より多くの価値を引き出すことができます。 LangChainは、開発から本番環境へのデプロイまで、大規模言語モデルアプリケーションのライフサイクルのあらゆる段階を簡素化します。具体的なツールとしては、ステートフルブローカーを構築するためのLangGraph、チェーンの検査と監視のためのLangSmith、オープンソースのビルディングブロック、コンポーネント、サードパーティとの統合などがあります。 MIT ライセンスのフレームワーク自体を含む特定の LangChain ツールは、GitHub で入手できます。 7. マインドDBMindsDBは、リアルタイムデータをAIシステムに接続するためのワークフローを自動化するオープンソースの仮想データベースおよび開発プラットフォームです。このソフトウェアにより、SQLクエリを使用した機械学習モデルの構築、トレーニング、デプロイが容易になります。 ソフトウェア開発会社であるMindsDBは2017年に設立され、米国サンフランシスコに本社を置いています。同社のウェブサイトによると、オープンソースソフトウェアにおける同社の使命は、機械学習の民主化です。この目標を達成するため、MindsDBは2023年9月に、AIスタートアップ企業と開発者のネットワークであるMindsDB AI Collectiveを立ち上げました。これは、オープンソースの機械学習およびAIプロジェクトを推進し、投資家、技術サポート、人材リソースを結びつけるものです。 MindsDB は、Y Combinator が資金提供している数多くのオープンソース テクノロジー スタートアップ企業の 1 つです。 MindsDB ソフトウェアはオープンソースの MIT ライセンスの下で提供されていますが、そのコアコンポーネントである MindsDB Core は Elastic v2 ライセンスの下で特別にライセンスされています。 8. オープンファウンドリーOpenFoundryプラットフォームは、オープンソースAIプロジェクト向けの開発者インフラストラクチャを提供します。このテクノロジーにより、エンジニアはオープンソースAI「スタック」の構築、展開、拡張を最大10倍高速化し、オープンソースのAI駆動型製品をより迅速にリリースできるようになるとされています。 OpenFoundryは、CEOのTyler Lehman(Metaの元プロダクトマネージャー)とCTOのArthur Chi(Slackのソフトウェアエンジニア)によって今年設立されたオープンソーステクノロジーのスタートアップ企業です。Y Combinatorからの出資を受けています。 Y CombinatorのウェブサイトにあるOpenFoundryのページでは、このスタートアップをHugging Faceの機械学習・データサイエンスプラットフォームのオープンソース代替として宣伝しています。OpenFoundryはMITライセンスに基づき、GitHubで公開されています。 9. オープンジティウェブサイト www.openziti.io によると、OpenZiti は、あらゆるアプリケーションにゼロトラストネットワークの原則を直接導入することに焦点を当てた、無料のオープンソースプロジェクトです。このプラットフォームは、ゼロトラストオーバーレイネットワークの実装に必要なすべてのコンポーネントを提供し、開発者がアプリケーションにゼロトラストを統合するために必要なすべてのツールを提供します。 ウェブサイトによれば、OpenZiti プロジェクトは「ゼロ トラストの原則はネットワーク内で止まるべきではなく、アプリケーションに統合されるべきだと考えている」とのことです。 OpenZiti は Apache 2.0 ライセンスの下で利用可能であり、OpenZiti.io Web サイトおよび GitHub からダウンロードできます。 OpenZiti のコンポーネントには、インテリジェント ルーティングが組み込まれたスケーラブルなオーバーレイ ネットワーク メッシュである The Fabric、オーバーレイ ネットワークの安全なエントリ ポイントを提供するコンポーネントである The Edge、開発者がゼロ トラストの原則をアプリケーションに組み込むことができる SDK、ゼロ トラストを組み込むことができないアプリケーションのギャップを埋めるトンネリング テクノロジが含まれます。 10. 20スタートアップ企業の Twenty は、アプリケーション大手 Salesforce の現代的な代替として、SaaS ベースのオープンソース CRM アプリケーションを開発するという大胆なミッションに取り組んでいます。 Twenty の Web サイトには、このソフトウェアは顧客データを管理するためのオペレーティング システムを提供し、タスクや「カンバン ビュー」ワークフローの視覚化など、主要な CRM システムのすべての機能を備えていると記載されています。 このアプリケーションはまだ初期の「アルファ」開発段階にあるが、誰でも同社の Web サイトおよび GitHub (GNU Affero General Public License に基づく) から入手できる。 最新バージョン 0.32.0 は 11 月 3 日にリリースされ、より強力な検索、Webhook フィルターと Webhook マルチオブジェクト フィルタリング、詳細設定と新しい設定レイアウト、ソフト削除機能、事前定義されていない値を格納するための新しい配列フィールド タイプなど、多くの新機能と拡張機能が含まれています。 Twentyは2023年に設立され、米国サンフランシスコに本社を置いています。Y Combinatorからの資金提供を受けています。 |