DUICUO

おすすめのオープンソースAIツール15選

[[171744]]

[51CTO.com クイック翻訳]これらのオープンソースの人工知能アプリケーションは、人工知能研究の最前線にあります。

人工知能(AI)は、技術研究において最もホットな分野の一つです。IBM、Google、Microsoft、Facebook、Amazonといった企業は、AI開発に多額の投資を行い、機械学習、ニューラルネットワーク、神経言語処理、画像処理といった分野で進歩を遂げているスタートアップ企業を買収しています。こうした高い関心の高さを考えると、スタンフォード大学が最近発表した知能研究レポートが「AIは2030年までにますます有用な応用が可能になり、社会と経済に大きなプラスの影響を与える可能性がある」と結論付けているのも当然と言えるでしょう。

この記事では、オープンソースの人工知能ツールに焦点を当て、最も有名なオープンソース AI プロジェクト 15 件を紹介します。

1. カフェ

Caffeは、カリフォルニア大学バークレー校の博士課程学生による傑作であり、式ベースのアーキテクチャとスケーラブルなコードに基づくディープラーニングフレームワークです。その高速性が最大の特徴であり、研究者や企業ユーザーの間で人気を博しています。公式ウェブサイトによると、NVIDIA K40 GPUのみを使用して、1日で6,000万枚以上の画像を処理できます。Caffeは、バークレー視覚学習センター(BVLC)によって管理され、NVIDIAやAmazonなどの企業からの資金提供を受けて開発されています。

関連リンク: http://caffe.berkeleyvision.org

2. CNTK

CNTKはComputational Networking Toolkitの略で、Microsoftのオープンソース人工知能ツールの一つです。CPUのみのシステム、シングルCPUのシステム、複数のGPUを搭載したシステム、複数のGPUを搭載した複数のマシンなど、どのシステムでも優れたパフォーマンスを発揮すると謳われています。Microsoftは主に音声認識の研究にCNTKを使用していますが、機械翻訳、画像認識、画像キャプション作成、テキスト処理、言語理解、言語モデリングなど、他の分野にも同様に応用可能です。

関連リンク: https://www.cntk.ai

3. ディープラーニング4j

Deeplearning4jは、Java仮想マシン(JVM)用のオープンソースのディープラーニングライブラリです。分散環境で実行され、HadoopおよびApache Sparkと統合されています。ユーザーはディープニューラルネットワークを自由に構成でき、Java、Scala、その他のJVM言語と互換性があります。

このプロジェクトは、有料サポート、トレーニング、および Deeplearning4j のエンタープライズ ディストリビューションを提供する Skymind という営利企業によって管理されています。

関連リンク: http://deeplearning4j.org

4. 分散機械学習ツールキット

CNTKと同様に、Distributed Machine Learning Toolkit(DMTK)はMicrosoftのオープンソース人工知能ツールの一つです。ビッグデータアプリケーション向けに設計されており、AIシステムの学習速度を大幅に向上させることを目指しています。DMTKは、DMTKフレームワーク、LightLDAトピックモデリングアルゴリズム、分散(Multisense)単語埋め込みアルゴリズムという3つの主要部分で構成されています。Microsoftは、8台のクラスターマシン上で「100億以上の重みを持つドキュメントコレクションに対して、100万のトピックと1000万語の語彙(10兆個のパラメータ)を持つトピックモデルを学習できる」と主張しています。これは他のツールでは達成できない性能であり、DMTKの驚異的な速度を実証しています。

関連リンク: http://www.dmtk.io

5. 水

H2Oは、研究よりも企業分野における人工知能の応用に重点を置いており、Capital One、Cisco、Nielsen Catalina、PayPal、Transamericaといった多くの大企業をユーザーに擁しています。H2Oは、機械学習と予測分析の力を活用して、誰もがビジネス上の問題を解決できると主張しています。予測モデリング、リスクおよび不正分析、保険分析、広告テクノロジー、ヘルスケア、顧客インテリジェンスなどに活用できます。

オープンソース版は標準のH2OとSparkling Waterの2種類があり、後者はApache Sparkと統合されています。また、有料のエンタープライズサポートも提供しています。

関連リンク: http://www.h2o.ai

6. マハウト

Mahoutは、Apache Software Foundation傘下のオープンソースの機械学習フレームワークです。公式ウェブサイトによると、Mahoutは3つの主要な機能を提供します。スケーラブルなアルゴリズムを構築するためのプログラミング環境、SparkやH2Oなどのツール向けにあらかじめ構築されたアルゴリズム、そしてSamsaraと呼ばれるベクトル数学実験環境です。MahoutはAdobe、Accenture、Foursquare、Intel、LinkedIn、Twitter、Yahooなど、数多くの企業で採用されています。公式ウェブサイトに掲載されているサードパーティプロバイダーを通じて、専門的なサポートを受けることができます。

関連リンク: http://mahout.apache.org

7. MLlib

Apache Sparkはその高速性で高く評価されており、最も人気のあるビッグデータ処理ツールの1つとなっています。MLlibはSparkのスケーラブルな機械学習ライブラリです。Hadoopと統合され、NumPyおよびRと連携できます。分類、回帰、決定木、レコメンデーション、クラスタリング、トピックモデリング、特徴量変換、モデル評価、機械学習パイプライン構築、機械学習の永続性、生存分析、高頻度アイテムセット、シーケンシャルパターンマイニング、分散線形代数、統計など、幅広い機械学習アルゴリズムを網羅しています。

関連リンク: https://spark.apache.org/mllib/

8. ニューピック

Numentaという企業が運営するNuPICは、階層的時間記憶(HTM)と呼ばれる理論に基づくオープンソースの人工知能プロジェクトです。HTMは本質的に、人間の脳の大脳新皮質を模倣したコンピュータシステムの構築を目指しています。その目標は、「多くの認知タスクの処理において人間のパフォーマンスに近づく、あるいはそれを上回る」マシンの開発です。

Numenta は、オープンソース ライセンスに加えて、NuPic を商用ライセンスでも提供しており、その技術の基礎となる特許のライセンスも提供しています。

関連リンク: http://numenta.org

9. オープンNN

OpenNNは、人工知能の理解を深め、ニューラルネットワークの実装を可能にする研究者や開発者向けに設計されたC++プログラミングライブラリです。主な特徴は、ディープラーニングアーキテクチャと優れたパフォーマンスです。公式ウェブサイトでは、ニューラルネットワークの基礎を解説する入門チュートリアルを含む包括的なドキュメントを提供しています。OpenNNの有料サポートは、予測分析を専門とするスペインの企業であるArtelnicsを通じてご利用いただけます。

関連リンク: http://www.opennn.net

10. オープンサイク

Cycorp社が開発したOpenCycは、ユーザーがCycの知識ベースと常識推論エンジンにアクセスできるようにします。OpenCycには、239,000語以上の用語、約2,093,000個のトリプル、そして約69,000個のowl:sameAsリンク(外部セマンティックデータ名前空間を指す)が含まれています。OpenCycは、ドメイン名モデリング、セマンティックデータ統合、テキスト理解、ドメイン特化型エキスパートシステム、ゲームAIの強化に利用されています。同社はCycの2つのバージョンも提供しています。研究者向けの非オープンソース版(無料版)と、エンタープライズユーザー向けの有料版です。

関連リンク: http://www.cyc.com/platform/opencyc/

11. オリックス2

Apache SparkとKafkaを基盤とするOryx 2は、大規模機械学習に特化したアプリケーション開発フレームワークです。独自の3層ラムダアーキテクチャを採用しています。開発者はOryx 2を用いて新しいアプリケーションを構築できるだけでなく、協調フィルタリング、分類、回帰、クラスタリングといった一般的なビッグデータタスクを処理するためのアプリケーションもあらかじめ用意されています。ビッグデータツールベンダーであるClouderaは、オリジナルのOryx 1プロジェクトを立ち上げ、その継続的な開発に深く関わってきました。

関連リンク: http://oryx.io

12. 予測IO

Salesforceは今年2月にPredictionIOを買収し、7月には商標とともにプラットフォームをApache Software Foundationに寄贈しました。Apache Software FoundationはPredictionIOをインキュベータープロジェクトに指定しました。SalesforceはPredictionIOの技術を機械学習機能の強化に活用する一方で、オープンソース版の開発も継続します。これにより、ユーザーは機械学習機能を備えた予測エンジンを構築し、動的なクエリにリアルタイムで応答するWebサービスを展開できるようになります。

関連リンク: https://prediction.io

13. システムML

SystemMLは元々IBMによって開発されましたが、現在はApache傘下のビッグデータプロジェクトです。R言語やPython風の構文で記述された高度な計算やアルゴリズムを実装するための、スケーラビリティの高いプラットフォームを提供します。既に多くの企業で、自動車修理における顧客サービスの追跡、空港の旅客動線誘導、ソーシャルメディアデータと銀行顧客の連携などに活用されています。SystemMLはSparkまたはHadoop上で実行できます。

関連リンク: http://systemml.apache.org

14. テンソルフロー

TensorFlowは、Googleが提供するオープンソースの人工知能ツールの一つです。データフローグラフを用いた数値計算のためのライブラリを提供します。単一または複数のCPUとGPUを搭載した幅広いシステム、さらにはモバイルデバイスでも実行できます。高い柔軟性、真の移植性、自動差分処理を誇り、PythonとC++をサポートしています。公式ウェブサイトには、TensorFlowの機能の利用や拡張に関心のある開発者や研究者向けに、豊富なチュートリアルや実用的な記事が掲載されています。

関連リンク: https://www.tensorflow.org

15. トーチ

Torchは、「GPUを多用する機械学習アルゴリズムを幅広くサポートする科学計算フレームワーク」と自称しています。ここで重視されているのは、柔軟性と速度です。さらに、機械学習、コンピュータービジョン、信号処理、並列処理、画像処理、ビデオ処理、音声処理、ネットワークなど、幅広いソフトウェアパッケージとの統合が容易です。LuaをベースにしたLuaJITというスクリプト言語を採用しています。

関連リンク: http://torch.ch

原題: オープンソース人工知能ツール トップ15、著者: シンシア・ハーベイ

[この記事は51CTOによって翻訳されました。提携サイトへの転載の際は、元の翻訳者と出典を51CTO.comとして明記してください。]