DUICUO

オープンソースデータベースプログラムの将来の発展を推進するトレンド

Wikipedia のオープンソース プロジェクトの説明によると、「現在、180,000 を超えるオープンソース プロジェクトと 1,400 を超える固有のライセンスが利用可能であり、『クローズド ソース』企業でオープンソース プロジェクトを管理する方法を決定する複雑さが劇的に増加しています。」

特定のプロジェクトでは、オープンソースのテクノロジースタックの組み合わせは無数に存在します。しかし、これらのアプリケーションによって生成されるペタバイト規模のデータは、最終的にはデータベースという一箇所に集約されます。これには、特に、そのデータの最適化とアクセスに使用されるオープンソースのデータベース、ツール、ミドルウェアが含まれます。

したがって、企業がどのプロジェクトを構築するかを選択する場合、オープンソースのデータベース プログラムは良い選択肢となります。

では、ベンダー主導の独自開発からオープンソースのデータ管理モデルへの移行を推進しているものは何でしょうか?この記事では、オープンソースデータベースプログラムの今後の発展を推進する主要なトレンドを概説し、企業がその道を先導するのに役立ついくつかのプロジェクト例を紹介します。

クラウドコンピューティングとSaaS

オープンソースのコードリポジトリとクラウドコンピューティングは、技術革新に革命をもたらしました。「データは新たな石油」と「ソフトウェアが世界を席巻している」という相反する考え方が、クラウド上でSaaS業界の成長を牽引しました。開発者は、ニーズに合わせてサービスを拡張し、アプリケーションをカスタマイズし、インターネット接続があればどこからでも、どんなデバイスからでもクラウドサービスを利用できます。ユーザーにとって、SaaSソフトウェアは「すぐに使える」状態で開発され、データベースと自動的に連携されます。ソフトウェア内で実行されるあらゆる操作やクエリは、デスクトップデバイスでもモバイルデバイスでも即座に応答することが期待されます。

ユーザーにとっては、これらはすべてある意味魔法のようですが、開発者にとっては、新しい計算モデルとそれらを動作させるためのコードを開発することは日々の課題です。そのため、オープンソースコミュニティは、このイノベーションを推進する原動力となっています。

この比較的新しいコンピューティングパラダイムにより、開発者はインフラコストやメンテナンスに多大な投資をすることなく、アプリケーションを迅速に市場に投入できます。これは20年前には不可能でしたが、このパラダイムにより、事実上すべての企業がソフトウェア主導の企業へと変貌を遂げました。クラウドコンピューティングとオープンソースデータベースを組み合わせることで、開発者はAmazonやGoogleなどの企業が提供する革新的なストレージおよびアクセス技術を活用できるようになります。これらの技術はベンダーでは提供が難しい場合があります。2021年9月に発表された最新の四半期報告書によると、オラクルの独自データベースライセンス収益は前年比8%減少しましたが、クラウドコンピューティング事業は40%成長しました。

独自のデータベースとコードを持つ従来型銀行は、突如としてChimeのようなチャレンジャーバンクとユーザー基盤と市場シェアを巡り競合する状況に陥りました。Chime Bankはクラウドのみで運営されており(支店は持たず)、モバイルファーストのバンキングSaaSアプリケーションとして運営されています。Chime Bankはクラウドファースト、オープンソース戦略を用いて10億ドル規模の企業を築き上げ、クラウドコンピューティングは従来型銀行が追随しようと躍起になっている戦略となっています。

ハイブリッドクラウド

ハイブリッドクラウドは、オープンソースデータベースが真価を発揮する領域です。その名の通り、ハイブリッドクラウドはオンプレミス、プライベートクラウド、サードパーティのクラウドサービスを組み合わせて、これらのプラットフォームをオーケストレーションします。これらのプラットフォーム上で一般的なアプリケーションが実行されます。この構成は近年進化を遂げ、クラウドコンピューティングのメリットを享受しながら、特定のワークロードをオンプレミスで維持したいという企業のニーズに対応しています。

オープンソースにより、企業は災害復旧やワークロード分散など、さまざまなデータベースを使用していても、あらゆる環境のあらゆるユースケースに適応できる共通のツールセットを持つことができます。

ビッグデータ

モバイルトラフィック、クラウドコンピューティングトラフィック、そしてモノのインターネット(IoT)や人工知能(AI)といった新技術の普及により、データの量と複雑さは急速に増加しています。Research and Marketsの2020年データ利用レポートによると、世界中で毎日2.5兆バイト以上のデータが生成されています。企業はこの変化に対応するために、データの保存と取得方法を継続的に革新する必要があります。オープンソースは、データサイエンスだけでなく、ハードウェアの最適化やコーディング効率の向上にも革新をもたらす最良の方法の一つです。

オープンソースのデータベースプロジェクトが今後も(オペレーティングシステムに次いで)最も人気のある理由の一つは、データです。IoT(モノのインターネット)やソーシャルメディアといった新しいアプリケーションが、大容量、高速、そして多様な形式で、日々膨大な量の情報を生成することで、データは絶えず蓄積されていきます。

企業は、こうしたデータを大規模に分析するための手法を採用する必要があります。オープンソース・データベースは、この点において従来のデータベースよりも優れています。近年、オープンソースやコミュニティ開発プロジェクトの動向は変化していますが、コミュニティ開発は依然として、99%のアプリケーションのデータアクセスにおけるイノベーションを促進する最良の方法です。

データベースに依存しないツールとミドルウェア

新たな現実は、企業がデータベースサービスに対してより分散化されたアプローチを採用するという技術シフトです。これにより、オンプレミス、クラウド、あるいはその両方のハイブリッドでホストできるシステムを構築するために、異なるベンダーの複数のデータベースインスタンスを検討することが必要となり、同時に一連の標準ツールとミドルウェアを通じてデータアクセスを簡素化する必要が生じます。

データベースがSQLかNoSQLかに関わらず、現代のリレーショナルデータベースは、テーブル、行、列において共通のスレッドを共有しています。このデータ構造により、ハイブリッドインフラストラクチャに分散されたデータを統合する新しいアクセスツールの出現が可能になります。例えば、ShardingSphereのようなオープンソースソリューションには、分散データストア全体にわたってデータをクエリおよび取得できる、SQLに依存しないツールが備わっています。

現在の傾向としては、顧客はもはや Microsoft や IBM のような大手サプライヤーに縛られることを望んでいません。

ソースコードへのアクセス

30年前、ベンダーロックインは良いことだと考えられていました。問題が発生した場合、ユーザーはベンダーからサポートを受けることができ、ベンダーのエンジニアリングチームが継続的にアプリケーションのパッチ適用とアップデートを行っていました。企業はライセンス、技術サポート、ソフトウェアアップグレードに法外な年間費用を支払っていました。例えば、Oracleプラットフォームをベースとしたアプリケーションのライフサイクルコストは、開発機能を除き、データベースソフトウェアとメンテナンスに限定されているため、数百万ドルに達することもありました。

アジャイルコード開発の時代において、ベンダーロックインはもはや好ましいことではありません。オープンソースの鍵となるのは、ソースコード部分です。共同キュレーションされたソースコードにアクセスすることで、開発者はソフトウェアベンダーではなく、自身のニーズと優先順位に基づいて変更を加えることができます。

オープンソースコミュニティ

ソースコードへのアクセスは、開発者や企業だけでなく、オープンソースコミュニティのメンバーで構成されるエコシステム全体にとって価値があります。これは好循環であり、オープンソースソフトウェアを採用する人が増えれば増えるほど、より多くのプロジェクトが開発されます。

素晴らしいブログ記事やツイートがバイラルに広がるように、優れたオープンソースソフトウェアもこのネットワーク効果を活用できます。このバイラル拡散の源はオープンソースコミュニティです。世界中の数十の貢献者コミュニティと数千人の開発者が、ゼロから構築された分散システムであるデータベースプロジェクトのコードを反復的に開発し、オープンソース化しています。

多様なコミュニティによって開発されるこのアプローチは、専任の開発チームが独自システムの脆弱性を悪用するよりも、より安定したソフトウェアを生み出します。先進的なオープンソースデータベースコミュニティの例としては、Apache ShardingSphere、CockroachDB、Yugabite、ClickHouseなどが挙げられます。例えばShardingSphereは、アジアだけで450人以上の貢献者がオープンソースコードベースに貢献しており、世界的に急速に拡大しています。今後数年間、企業は増大し続けるデータフローへのアクセス、スピード、そして制御の向上を求めるため、データベースソフトウェアへの貢献と採用は確実に大幅に増加するでしょう。

例えば、オープンソースデータベースプロジェクト「Momentum」を支援するオープンソース貢献者コミュニティは、Momentumの複数のバージョンにおける重大な欠陥に対処し、ライブラリ、リポジトリ、ドキュメント、さらにはYouTube動画を作成して、新規貢献者を奨励してきました。O'ReillyMediaとIBMは2020年に3,400人の開発者と技術マネージャーを対象に調査を実施しました。調査報告書では、次のような結果が出ています。

  • 回答者の 94% は、オープンソース ソフトウェアはプロプライエタリ ソフトウェアと同等かそれ以上であると信じています。
  • 回答者の 70% は、オープンソースのクラウド コンピューティング プロバイダーが提供するソフトウェアを使用することを好みます。
  • 回答者の 65% は、オープンソース プロジェクトに参加することでキャリアのチャンスが向上すると考えています。

仮想ソフトウェアカタログ

オープンソースアプリケーションは簡単に見つかります。Googleで「オープンソース データバックアップとリカバリ」を検索すると、検索結果には少なくとも17種類、あるいはそれ以上の無料オープンソースバックアップソリューションが表示されます。

2020年1月現在、GitHubは4,000万人以上のユーザーと190万以上のリポジトリ(パブリックリポジトリ2,800万を含む)を擁しています。ユーザーはGitHubを様々な方法で検索できます。例えば、GitHubはリポジトリのタイトル、説明、readmeファイルなど、特定のフィールドを対象とした高度な検索をサポートしています。データベースについて学ぶための優れたリポジトリを見つけたい場合は、「in:name database」のように検索できます。

独自の製品スイートと比較すると、オープンソース ソフトウェアの分野では、ユーザーがいつでも変更できる適切なソリューションを見つけられる可能性が高くなります。

最高情報責任者兼セキュリティ

調査によると、CIOの3分の2以上がクラウドコンピューティングプロバイダーへの依存を懸念しています。そのため、これがオープンソースデータベース導入のもう一つの大きな推進力となっています。

ランサムウェアの時代において、データセキュリティは企業にとって生き残りをかけた課題です。オープンソース技術は、ソースコードと設定への完全なアクセスを提供することで、企業がセキュリティニーズを完全にコントロールすることを可能にし、ソフトウェアを好みの方法で拡張することを可能にします。

オープンソースのセキュリティについて懸念する人は多くいます。多くの企業によるオープンソースの急速な導入は、この議論に終止符を打ったように思われます。しかし実際には、オープンソースデータベースの影響から逃れられる企業は存在しません。

新たな例

メタバースなどの新しいテクノロジーの開発により、オープンソース データベース プログラムの優先選択肢となる一連の新しいテクノロジーが人々に体験されることになるでしょう。

たとえば、Apache Shardingsphere が提供する新しいオープンソース エコシステムと、テクノロジに依存しない分散データベース プラグ アンド プレイ モジュールは、貢献者であれ企業であれ、開発者にとって使いやすく導入しやすいものになっています。

Kubernetes (Google のクラウド コンテナ オーケストレーション テクノロジー) は、プログラマーがメリットを享受できる、オープンソース データベースのデプロイメントにおけるもう 1 つの重要な API です。

今後5年間、オープンソース開発は需要主導型になるでしょう。業界の動向は、オープンソースがもはや選択肢ではなく、標準となることを示唆しています。したがって、企業は競争力を維持するために、オープンソースを積極的に活用する必要があります。

元記事のリンク: オープンソースデータベースプログラムの将来動向、著者: Yacine Si Tayeb