DUICUO

オープンソース コミュニティが貢献しないことは危険です。

ビッグデータの時代には、 Intelも「インサイド」となり、より多くの x86 アーキテクチャ製品が使用されることになります。

さらに、Intel は 2013 年初頭に独自のHadoopディストリビューションを開始しました。今年 3 月には、Hadoop エコシステムの有力企業である Cloudera に 7 億 4,000 万ドルを投資し、18% の株式を取得しました。

「現在、インテルとClouderaのそれぞれのHadoopディストリビューションは統合されています」と、インテルの中国産業コラボレーションおよびソリューショングループのゼネラルマネージャーであるLing Qi氏は、8月27日の21世紀ビジネスヘラルドとの独占インタビューで語った。

リン・チー氏は、ビッグデータはまだ比較的初期段階にあり、道のりは長いものの、将来ビッグデータが金鉱となることに疑いの余地はないと述べた。「1990年代に初めてパソコンに触れた時と同じように、とてもワクワクしています。」

同時に、Ling Qi氏は、Hadoopオープンソースコミュニティには認められたフィードバックメカニズムがあることを強調しました。一部のベンダーがこれを閉鎖すれば、オープンソースコミュニティのこのメカニズムに違反するだけでなく、主流から取り残され、将来的に時代遅れになるリスクに直面する可能性があります。「これは顧客の移行リスクをもたらします。」

ビッグデータは落ち着く必要がある

21世紀:ビッグデータについてどう思いますか?今は過剰に宣伝されすぎているのでしょうか?

Ling Qi:データは常に存在していましたが、データの種類、規模、そしてそこから価値を引き出す可能性の違いが、ビッグデータという概念を生み出しました。今日のデータ取得の多くは、構造化プロセスで多くの価値が失われるため、最初は非構造化データとして取得されます。もちろん、これは構造化データを拒否することを意味するものではありません。

ビッグデータの価値と可能性は、インターネットが誕生当初は用途が限られていたのと同様に、現時点ではまだ十分に発揮されていません。しかし、その未来は無限の可能性に満ちています。こうした観点から見ると、現在ビッグデータが注目を集めているのも当然と言えるでしょう。

概念的な観点から言えば、ビッグデータは重要な問題であるという評価は今や誰もが認めている。では、それをさらに大々的に宣伝する意味は何だろうか? 重要なのは、人々の関心を高めることであり、それ以上ではない。

もちろん、ビッグデータについて語る人は多いものの、実際に何ができるのか、あるいはその応用シナリオやモデルを深く探究し活用する人は少ない。例えば、金融業界における不正防止、通信業界における詳細な請求書分析、社内業務分析、精密マーケティングなど、ビッグデータは様々な分野で活用されているが、これらの分野はまだ十分に活用されていない。

ですから、どんなに壮大なコンセプトが誇張されていても、それはそれほど重要ではありません。最も重要なのは、応用の観点から、落ち着いて、綿密かつ綿密な作業を行うことです。

21世紀ビジネス・ヘラルド:アプリケーションにボトルネックはありますか? あるいは、それをどのように克服すべきでしょうか?

Ling Qi: これは実際には生態環境の問題です。アプリケーション開発者とユーザーは、アプリケーションのニーズ、アプリケーションモデル、将来のアプリケーションの方向性、そして解決したい問題について話し合い、理解する必要があります。

このプロセスには単一のアプローチはありません。石油会社、保険会社、運輸会社、小売業など、業界によって適切なアプリケーションは異なります。

内部の観点からは、各部門はオープンマインドである必要があります。ビジネスに携わる人は潜在的なアプリケーションを把握する必要があり、アプリケーションを適用する人はビジネスを理解する必要があります。

実務家として、私たちは市場教育と研修をもっと行う必要があります。そうでなければ、ただコンセプトを大げさに宣伝するだけでは意味がありません。しっかりとした取り組みを行い、研修と教育を提供し、効果的な応用を促進する必要があります。

ビッグデータの開発にもプロセスが必要であることを指摘しておく必要があります。私の個人的な経験から言うと、開発のスピードは実に速いです。2年前に業界交流会に参加した時は、誰もがまだコンセプトや構想について語っていましたが、今では誰もがビッグデータからどのように価値を引き出すかに焦点を絞り、具体的な活用方法について議論しています。

IOE (IBM、Oracle、EMC) はもはや存続不可能であると言うのは偏った見方です。

21世紀ビジネス・ヘラルド:ビッグデータは企業のIT調達と予算支出にどのような影響を与えるのでしょうか?今年は「脱IOE」という非常にホットな言葉が話題になっていますね。

Ling Qi: 分散型ビッグデータ技術と比較すると、集中型ストレージ、コンピューティング、リレーショナルデータベースは、当時はデータが限られているアプリケーション シナリオに適しており、それらの連携は効果的でしたし、それは現在でも有効です。

IOE(IBM、Oracle、EMC)はもはや有効ではないという意見は偏った見方です。当時の問題解決において、IOEの価値は依然として認識されています。しかし、コンピューティングはそこで終わるものではありません。かつては、社内データ中心のITアーキテクチャに適応してきたのです。しかし、現在では多くのデータ取得が社内業務の範囲を超えており、従来のシステムとアーキテクチャではもはや十分ではありません。

これは技術アーキテクチャレベルの話です。しかし、このバズワードを特定の企業に結びつけると話は別です。外部の市場環境が企業内部の変化を促します。抜本的な変革は困難ですが、大企業は必然的にこうした変化を経験せざるを得ません。例えばインテルは、当初はメモリを製造していました。しかし、日本メーカーの参入により、プロセス技術、コスト、効率性といった面での優位性を失い、この事業の収益性に大きな打撃を受けました。その後、私たちはマイクロプロセッサへと事業の重点を移しました。

ビッグデータに基づく新しいアーキテクチャは、第一に、コストが以前よりも比較的低く、第二に、将来の可能性が大きいと考えています。

21 世紀ビジネスヘラルド: 企業はビッグデータ プラットフォームの商用版をどのように選択すべきでしょうか?

Ling Qi:これは当社の事業に関係しています。従来型の企業は、IT投資を迅速に実装・最適化し、ビジネス目標の達成につなげられる、比較的標準化されたプラットフォームを求めています。

インターネット企業はシステム全体の最適化に多額の投資を行っています。そのため、純粋に商用版を使用しているインターネット企業は稀で、ほとんどの企業はオープンソースのリソースを活用し、二次開発を行っています。一方、従来型の企業は、既に成熟したバージョンを好む傾向があります。

21 世紀: なぜこのような違いがあるのでしょうか?

Ling Qi:実は、すべてのビジネスクライアントに共通する特徴があります。それは、費用対効果を重視することです。費用が高くても、メリットがさらに高ければ、それは実行可能だと考えます。逆に、費用が低くても、メリットがさらに低ければ、それは実行不可能だと考えます。

インターネット企業は、分散ストレージやHadoopなどのオープンソースソリューション、そして二次開発を活用することで、課題解決とビジネスモデルの基盤構築を実現できます。かつては、典型的なインターネット企業は数百台から数千台のサーバーしか保有していませんでしたが、現在では数十万台、さらには数百万台ものサーバーを保有しています。従来のアーキテクチャでは、莫大なコストがかかっていたでしょう。しかし、Hadoopのような分散ストレージとデータプラットフォームを活用することで、コストを大幅に削減することが可能です。

もちろん、問題解決の観点から見ると、コストは絶対的に低いとは言えませんが、むしろ相対的に低いと言えます。利用コストに加えて、二次的な開発や保守にかかるコストも存在します。

従来型の企業にとって、これは段階的なプロセスです。例えば、インターネット金融を例に挙げてみましょう。インターネット企業は、主に取引情報を収集する銀行よりも、ユーザーの行動をはるかに深く理解していると考えられます。銀行が顧客基盤を拡大し、より多くの顧客にリーチしたい場合、インターネット企業と提携して顧客行動情報を収集し、マーケティング活動をターゲティングすることも可能です。この時点で、銀行が事業拡大を検討する際には、それを支えるビッグデータ分析システムが必要になります。

21世紀ビジネス・ヘラルド:企業をインターネット企業と従来型企業に分類されていますが、通信や金融といった大企業は、独自のソリューションを開発する方が適していると思いますか、それとも標準バージョンを選択する方が適していると思いますか?

凌奇:伝統的な企業が自社システムを開発するのは、合理的な道筋ではないと思います。結局のところ、これらの企業にはそれぞれコアビジネスがあります。例えば、石油会社は石油の採掘と精製を行っており、ITはそれらを支えるツールです。そのため、商用版を利用する方が適切です。一方、インターネット企業の場合、ITアーキテクチャ全体がほぼ生命線であり、生産設備そのものなので、少し異なります。

従来型の企業にとって、Hadoopは標準的なインフラストラクチャです。その基本アーキテクチャはオープンであるため、将来的には様々なテクノロジーやベンダーを柔軟に選択できます。しかし、一度Hadoopを導入したからといって、特定のベンダーに縛られるわけではありません。

もちろん、インフラの上位にあるアプリケーション層では、各社が独自の強みを持つか、あるいは開発を通じて独自の目標を達成できる必要があります。例えば、個人向け預金・融資業務に重点を置く銀行もあれば、法人向け融資に重点を置く銀行、国際貿易に重点を置く銀行もあるでしょう。これは、それぞれの上に構築されるアプリケーションに関係していると考えられます。このような場合、アプリケーションが独立して運用できる安定した技術アーキテクチャが必要です。

オープンソースコミュニティにはフィードバックメカニズムが必要

21世紀ビジネス・ヘラルド:供給側から見ると、ビッグデータ・ソリューションは理想的なものと言えるでしょうか?企業は依然として、基本レベルでカスタマイズされた開発を行う必要があるのでしょうか?

Ling Qi: 現状では、Hadoop のような基本プラットフォームは、基本的に、オープンソース コミュニティによる成果を一部のベンダーが最適化して形成した安定バージョンです。

オープンソースコミュニティは、一般的に誰からの貢献も歓迎します。こうした貢献が、主流の構造と多数のブランチへとつながります。最善のアプローチは、主流に従うことです。これにより、システムを異なるベンダー間で容易に切り替えることができ、ベンダーロックインに陥ることなく、将来のテクノロジーにも対応できるようになります。例えば、将来、あるブランチが主流になった場合、チャンスが生まれます。

したがって、どのベンダーがHadoopオープンソースコミュニティに多く貢献しているかに注目する必要があります。これは、ベンダーの総合的な技術力と、将来の主流への導入への影響を示すものだからです。時間の経過とともに、一部の技術は主流にならなくなる可能性があります。そうなると、将来のアップグレードでこれらの非主流技術との互換性の問題が発生し、孤立したシステムが形成される可能性があります。これは、企業にとって将来のアップグレードに大きな支障をきたし、コストを増加させる可能性があります。

したがって、主流の方向へ進むことに重点を置くべきです。どのベンダーが主流と見なされているのでしょうか?これらのベンダーがオープンソースコミュニティにどれだけ貢献しているか、そしてその貢献がオープンソースコミュニティの基盤となるかどうかに主に注目すべきです。もしそうであれば、これらのベンダーの未来は明るいと言えるでしょう。

21 世紀: 今、最も大きな貢献をしているのが誰でしょうか?

Ling Qi: オープンソースコミュニティには誰でも貢献できますが、オープンソースコミュニティにはメインスレッドが存在します。このメインスレッドの責任者は誰でしょうか?それはメインコントリビューターです。

例えば、Clouderaの従業員数はわずか700人ほどですが、そのうち約100人がオープンソースコミュニティへの主要な貢献者です。これは非常に大きな力であり、同社の取り組みはオープンソースコミュニティに大きく吸収され、主流となることを意味します。

21世紀ビジネスヘラルド:社会に還元せず、徐々に独自のバージョンを開発していく企業もあるのでしょうか?

Ling Qi: オープンコミュニティの精神という観点から言えば、オープンコミュニティから何かを得て改善に努める人は、オープンコミュニティに還元する責任も負います。一定のルールがあり、コミュニティに還元する責任があるのです。

大企業であれば、規模の大きさから独自のシステムを開発・管理できるため、これは大きな問題にはならないかもしれません。しかし、商用版の開発者にとっては、これは非常にリスクの高い行動です。顧客が主流のソリューションを放棄する可能性があり、データ移行ができなくなるなどのリスクにつながる可能性があります。これは単なる倫理的な問題ではありません。そのため、従来の開発ベンダーの多くは、通常、このような慣行を避けています。