|
近年、マイクロソフトはコンピュータービジョンの分野で大きな進歩を遂げており、顔認識、画像理解、検索、ドローン、地図、半自律運転、自律運転などの分野に応用されています。 Microsoftは、コンピュータービジョンライブラリ「computervision-recipes」をオープンソース化しました。このライブラリには、この分野のベストプラクティス、コード例、そして広範なドキュメントが含まれています。データサイエンティストと機械学習エンジニア向けに特別に設計されたこのリポジトリは、今週のGitHubトレンドリストで5,300個のスターと608個のフォークを獲得し、トップにランクインしました(GitHubアドレス:https://github.com/microsoft/computervision-recipes)。 computervision-recipes は、最先端のコンピュータービジョンアルゴリズム、ニューラルネットワークアーキテクチャなどを活用するための包括的なコンピュータービジョンツールとコードサンプルスイートの構築を目指しています。このライブラリは、実装をゼロから作成する方法を教えるのではなく、既存の最先端ライブラリから画像データの読み込み、モデルの最適化と評価、クラウドへのスケーリングのための追加ユーティリティを抽出し、構築します。 さらに、マイクロソフトは次のように述べています。「当社は長年にわたってこの分野で活動しており、このプロジェクトを通じて、ビジョン分野における一般的な質問に答え、明らかなバグを指摘し、トレーニングと展開にクラウドを使用する方法を示すことを目指しています。」 例 このリポジトリは、単一の画像で実行されるさまざまなコンピューター ビジョン スキームをサポートしています。 ビデオシーケンスを入力として使用するアクション認識などのシナリオ: このライブラリでカバーされる一般的なコンピューター ビジョンのシナリオには、次のカテゴリが含まれます。 各メインシナリオ(ベース)において、プロジェクトはユーザーが効率的に独自のモデルを構築できるツールを提供します。ユーザーは、独自のデータに基づいてモデルを微調整するといった単純なタスクから、ハードサンプルマイニングやモデルのデプロイメントといった複雑なタスクまで、様々なタスクを完了する必要があります。 このプロジェクトに興味がある方は、GitHub ページにアクセスして詳細を確認してください。 |