|
大規模なデータサイエンティストの職種の面接を受けたことがある方なら、候補者がソフトウェアエンジニアリング、機械学習、金融、マーケティングなど、多様なバックグラウンドを持っていることに気付くでしょう。これらの候補者は、データサイエンスの経験が限られている場合でも、一般的に自身のプロジェクトのポートフォリオを保有しています。採用担当者やマネージャーは、オープンソースプロジェクトを1つか2つ成功させた経験を持つ候補者を高く評価する傾向があります。 本日は、優れたオープンソースのデータサイエンスプロジェクトを6つご紹介します。コンピュータービジョンの専門家の需要は年々着実に増加しています。データサイエンスの専門家として、やるべきこと、学ぶべきことはたくさんあります。これらの6つのオープンソースプロジェクトが、皆様のお役に立てれば幸いです。 1. 数ショットのvid2vid昨年、私はビデオツービデオ (vid2vid) 合成の概念に偶然出会い、その有効性に驚きました。vid2vid は基本的に、意味的に入力されたビデオを超現実的なビデオ出力に変換します。 ただし、これらの vid2vid モデルには現在 2 つの主な制限があります。
これが NVIDIA の viv2vid フレームワークの威力です。セグメンテーション マスク、スケッチ、人間のポーズなど、さまざまな入力形式にわたって、高解像度でリアル、かつ時間的に一貫したビデオ効果を実現できます。 このGitHubリポジトリはPyTorch実装です。この記事を参考に、独自の動画分類モデルの設計方法を学び始めることができます。(記事リンク:https://www.analyticsvidhya.com/blog/2019/09/step-by-step-deep-learning-tutorial-video-classification-python/?utm_source=blog&utm_medium=6-open-source-data-science-projects) GitHub アドレス: https://github.com/NVlabs/few-shot-vid2vid 2. 超軽量・高速顔検出これは、サイズがわずか 1MB の顔検出モデルの超軽量バージョンです。 このモデルは、エッジコンピューティングデバイスや低計算能力デバイス(ARM推論を使用するデバイスなど)向けに設計されています。ARMなどの低計算能力デバイスにおいて、一般的なシナリオでリアルタイムの顔検出推論を実行できるだけでなく、モバイルデバイスやPCにも適用できます。 GitHub アドレス: https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB 3. ガウス_YOLOv3私は自動運転車の大ファンなので、自動運転に関連するフレームワークやアルゴリズムの新たな開発には興奮するべきだと考えています。 物体検出アルゴリズムはこれらの自動運転システムの中核であり、高い精度と高速な推論速度が運転の安全性を確保する鍵となります。では、このプロジェクトの驚くべき特徴は何でしょうか? Gaussian YOLOv3アーキテクチャは、システムの検出精度を向上させ、リアルタイム動作をサポートします。従来のYOLOv3と比較して、Gaussian YOLOv3はKITTIデータセットとBerkeleyディープドライブ(BDD)データセットの平均精度(mAP)をそれぞれ3.09と3.5向上させます。 Githubアドレス: https://github.com/jwchoi384/Gaussian_YOLOv3 4. T5このリストにGoogleが欠かせません。Googleは機械学習、ディープラーニング、強化学習の研究に多大な投資を行っており、その研究成果はそれを反映しています。また、Googleのオープンソースプロジェクトからも多くのことを学ぶことができます。 T5 GitHubリポジトリでは、データセット、事前学習済みモデル、そしてT5のコードがオープンソース化されています。110億パラメータを持つGoogleのT5事前学習済みモデルは、Glueのリーダーボードで再びトップに立ち、NLPにおける新たな最先端(SOTA)事前学習済みモデルとなりました。NLPは現在最もホットな分野の一つであり、その最新の成果を見逃したくない方は、このプロジェクトをぜひチェックしてみてください。 GitHub アドレス: https://github.com/google-research/text-to-text-transfer-transformer 5. ナレッジグラフデータ1億4000万のデータポイントを含む、史上最大のオープンソース中国語ナレッジグラフが、.csv形式でダウンロード可能です。簡単に言うと、ナレッジグラフとは、知識を関係性を通してネットワークに整理するネットワーク構造です。人工知能はこのグラフを用いて、現実世界の出来事(現実のものか架空のものかを問わず)を理解することができます。 ナレッジグラフは、ロボットの質問応答システムや知識推薦などに応用できます。下の画像は、ロボットにおけるナレッジグラフの応用を示しています。 GitHub アドレス: https://github.com/ownthink/KnowledgeGraphData 6. ラフビズroughViz.js は、D3v5、roughjs に基づく再利用可能な JavaScript ライブラリであり、ブラウザーでラフ/手描きスタイルのチャートを作成するのに便利です。 次のコマンドを使用して、roughViz をマシンにインストールできます。
roughViz を使用すると、次のグラフを生成できます。
Githubアドレス: https://github.com/jwilber/roughViz |