DUICUO

オープンソースの検索プラットフォームを使用している企業はどれですか?

[51CTO 5月9日 海外ニュースヘッドライン] Twitter、Facebook、そして議会図書館。これら3つの主要機関は、膨大な量の構造化データと非構造化データを保有しており、これらのデータを迅速にインデックス化し、検索する必要があります。例えばTwitterは、毎日約3億件の新規メッセージをインデックス化する必要があります。

そのため、これらの組織がオープンソース検索アプリケーションという一見未知の領域に大胆に進出しているのも不思議ではありません。コスト削減だけでなく、アプリケーションの迅速なカスタマイズや変更が可能だからです。さらに、オープンソース技術は活発なコミュニティを誇り、関連する問題の解決に役立ちます。

しかし、他の企業ユーザーはどうでしょうか? 著名な調査会社ガートナー・グループによると、今日の一般的な企業では、様々な形式のテキスト、メール、ブログ、動画など、約80%の情報が非構造化されており、この割合は増加傾向にあります。こうしたデータはすべて潜在的に価値を秘めており、今日ではあらゆるウェブサイトが、最高のインターネット検索エンジンと同等の速度でクエリを実行し、関連する結果を提供できる必要があります。ガートナー・グループのアナリスト、ホイット・アンドリュース氏は、「今日、人々はほぼすべての仕事で検索テクノロジーを必要としています。誰もが、検索機能があらゆる側面に組み込まれると考えています」と述べています。

現在、ほとんどの企業の検索機能は非常に限られており、多くの場合SQLクエリや特定のフォーム、レポートに基づいています。彼はさらに、「データ量が膨大すぎるため、このモデルはすぐに維持できなくなるでしょう。しかも、24時間365日体制の環境ではデータ量は急速に増加しています」と付け加えました。

重要な検索機能

様々な企業が、収集した構造化データと非構造化データを分析するために、オープンソースの検索アプリケーションを検討し始めています。Lucene Solrはそうした製品の一つで、このオープンソースの検索プラットフォームは、カリフォルニア州サンマテオに本社を置くソフトウェア企業Lucid Imaginationによって開発されました。

3年前、オープンソース検索アプリケーションへの関心が急上昇しました。「Lucid Imaginationは、オープンソースソフトウェア向けの商用サポートサービスの提供を目的として、その頃に設立されました」と、Black Duck Software傘下のオープンソースコンサルティング会社Olliance Groupのシニアエグゼクティブ、Greg Olson氏は述べています。「これは、Luceneのような新しい技術を中心としたサービスやソリューションの必要性を明確に示しました。」

アンドリュース氏は、Luceneが検索を多用するユーザーをターゲットにしていることは間違いないと述べました。「Luceneは、高度な検索ソリューションや製品を必要とする人々にとって重要です。典型的なユーザーは、大規模な技術適用を必要とするベンダーです。これはLuceneを使用するのに最適な環境です。膨大な量の情報を検索する必要があるからです。来週木曜日までに検索する必要があるイントラネットでLuceneが使用されることはまずないでしょう。」

他にも複数のベンダーが、同じオープンソースのLuceneテクノロジーをベースにした軽量な検索ツールを提供しています。例えば、オンライン小売業者のZappos.comはLucene Solrを使用しており、月間最大6,300万件の顧客クエリをサポートしています。しかし、社内ではオープンソースの検索エンジンElasticsearchを「クリティカルではないウェブサイトシステムや、パフォーマンス制約のないサービス」に導入していると、検索チーム責任者のAye Thu氏は述べています。

最近、多くの検索アプリケーション開発会社が大手ソフトウェア企業に買収され、今後の方向性に疑問が生じています。2008年には、マイクロソフトが検索アプリケーション「Fast Search & Transfer」を買収し、SharePointを通じてユーザーに提供しました。2011年8月には、HPが英国に拠点を置くAutonomyを買収し、その2か月後にはOracleが、非構造化データ管理、インターネットコマース、ビジネスインテリジェンスソリューションを提供するEndecaの買収計画を発表しました。

これらのソフトウェア大手はいずれも、買収したばかりの検索エンジンのサポートを停止する意向を示していないが、「自分の技術プロバイダーが別の企業に買収されると不安になるものだが、自分がその技術プロバイダーの立場であればなおさらだ」とアンドリュース氏は語った。

これにより、Lucene Solrは独立系エンタープライズ検索プラットフォームのリーダーとなりました。Lucid社によると、Lucene Solrのダウンロード数は月間20万~30万件に達しています。

EMCは、リレーショナルデータベースソリューション向けのテキスト分析アタッチメントの開発にLucene Solrを使用しています。EMCの研究開発担当シニアディレクター、ジョージ・チトゥラス氏は次のように述べています。「エンタープライズ検索業界を見てみると、従来のベンダーのほとんどが買収されるか、あるいは単に無視されていることがわかります。私の意見では、現在最も成長の勢いがあり、各国のチームが急速に成熟しつつあるテクノロジーは、Lucene Solrです。」

EMCはまだオープンソースの検索機能を自社の業務に導入していないものの、チトゥラス氏は、この技術がほぼあらゆる業界で広く利用されていると感じていると述べています。「コールセンター業務、顧客関係管理、イノベーション管理など、あらゆる大企業が情報検索に活用できます。」

オープンソースソリューション

2011年半ば、Lucid ImaginationはLucidWorksをエンタープライズユーザー向けにリリースしました。このサブスクリプションベースのエンタープライズソフトウェアパッケージは、オープンソース検索の専門家によってサポートされており、現在100社のエンタープライズ顧客が利用しています。Lucidは今年2月、クラウドベースのSaaS(Search as a Service)版もリリースしました。

LucidのCEO、ポール・ドッシャー氏は、多くの組織がエンタープライズ向けオープンソース検索製品を導入する理由は3つあると考えています。まず、「人々はウェブサイトの運営に効率的な検索技術を使いたいと考えていますが、その技術のインフラ、管理、メンテナンスについて心配したくないのです」と述べています。LucidWorksはウェブサイトに接続し、データを取得し、検索ボックスに結果を表示します。「これは、現在利用されているものよりもはるかに高度な機能です」とドッシャー氏は付け加えます。

第二に、プロトタイプのアプリケーション ソフトウェアを開発するためのサンドボックスを必要としているものの、それに対応する開発の専門知識、インフラストラクチャ、またはハードウェアが不足している大企業は、多くの場合、オープン ソースの検索テクノロジに目を向けます。

第三に、既存データの価値をさらに活用したい企業は、オープンソースソリューションを積極的に導入する可能性があります。Doscher氏は、SaaS(Search as a Service)アプリケーションがこうしたユーザーを引き付ける可能性があると示唆しています。Salesforce.comが提供するアプリケーションと同様に、Lucidのクラウドベースアプリケーションも、SaaS(Software as a Service)アプリケーション内で情報を検索できるようにすることで、より効率的な情報検索や、企業内または外部ネットワーク上の他の情報との統合を可能にします。Doscher氏は、「よりリッチで効率的な情報アプリケーションを開発するためのアプリケーション開発プラットフォームとして活用できる」と述べています。

Lucidのチーフサイエンティスト、グラント・インガソル氏も、オープンソースの検索技術にはハイブリッドな用途があると考えています。「自社のデータセンター内で独自のアプリケーションを提供することもできますが、そうするとクラウド環境でサポートされているアプリケーションに過剰な機能を提供してしまう可能性があります」と彼は述べています。

ドッシャー氏は、競争優位を維持するために、ルシッド・イマジネーションはビジネスインテリジェンスとデータウェアハウス分野への参入、そしてビッグデータ技術との統合を計画していると述べた。「従来のデータウェアハウスやビジネスインテリジェンスアプリケーションをHadoopプラットフォーム上に構築することは、マンホールの蓋を庭のホースに押し込むようなものです」と同氏は述べた。これらの分野にオープンソースの検索技術を適用することで、膨大なデータ量と不十分なインデックス作成および検索機能によって引き起こされるプレッシャーを軽減できると期待されている。

ドッシャー氏は、将来、企業が保管する情報量は「恐ろしいほど膨大」になると述べています。オープンソースの検索技術は、この情報過多への対処に役立つと期待されています。

ドッシャー氏は次のように述べています。「Googleの検索技術がインターネットに革命をもたらしたように、私たちの技術は、企業内の情報の消費者化を支援することで、企業に革命をもたらすと信じています。最終的には、企業が運用するあらゆるデータベース、アプリケーション、そしてERPシステムに適用可能な、自然言語によるクエリを企業内で実行できるようになります。これにより、人々は関心のあるトピックに関する統合された、文脈に応じたリアルタイム情報に即座にアクセスできるようになります。」

元のテキスト: オープンソースの検索アプリケーションが企業向けに進化

[編集者のおすすめ]

  • オープンソースソフトウェアと特許製品の間の戦いが激化しています。
  • オープンソースソフトウェア開発から学んだ教訓
  • Instagramを支えるオープンソース技術
  • Java全文検索エンジンLucene 3.6がリリースされました