FacebookがPyTorch3Dをオープンソース化：PyTorchベースの新しい3Dコンピュータビジョンライブラリ

PyTorch が 3D コンピュータービジョンの分野に参入し、専用のライブラリがリリースされました。

3Dコンピュータビジョンは重要なトピックです。より優れた効率的な処理結果を得るために、適切な計算フレームワークを選択するにはどうすればよいでしょうか？最近、Facebookブログの新しい記事で、チームが開発した3Dコンピュータビジョン用フレームワーク「PyTorch3D」が紹介されました。これはPyTorchベースのライブラリで、3Dモデリングやレンダリングなど、様々な処理において優れたパフォーマンスを提供します。

プロジェクトアドレス: https://github.com/facebookresearch/pytorch3d

PyTorch をベースにした 3D コンピュータービジョン処理ライブラリ

プロジェクトの説明によると、PyTorch3dは高性能で再利用可能な3Dコンピュータービジョンライブラリです。このプロジェクトでは、開発者は以下の新機能を実装しました。

1. 彼らは、三角形メッシュデータをより適切に保存および変更できる新しい 3D データ構造「メッシュ」を提案しました。

2. 投影変換、グラフ畳み込み、サンプリング、損失関数など、三角形メッシュを効率的に処理する演算子。

3. 微分可能なメッシュジェネレータ。

PyTorchをベースとしているため、このフレームワークは主にディープラーニングモデル向けに設計されています。このプロジェクトは、3Dコンピュータービジョンとディープラーニングを組み合わせ、3Dデータの予測と計算を実現することを目指しています。PyTorch3Dでは、すべての演算子は以下のとおりです。

1. PyTorch 演算子を使用する。

2. 異種のバッチデータを使用できます。

3. 微分可能

4. GPU アクセラレーションを使用可能

このように、PyTorch3D はディープラーニングフレームワークの利点を吸収しながら、3D モデリングとレンダリングに特化した計算も実行できるため、優れたパフォーマンスとアプリケーションの利点が得られます。

主な特徴

PyTorch3D には注目すべき 3 つの新機能があり、Facebook のブログ投稿で説明されています。

3Dメッシュデータの新しい形式: メッシュ

3Dメッシュは頂点座標と面インデックスの両方で構成されているため、異なるサイズの3Dメッシュをバッチ処理する際には調整が必要になります。この問題に対処するため、研究者らは、ディープラーニングアプリケーションにおいて異種ネットワークをバッチ処理できるデータ構造「Meshes」を提案しました。

メッシュデータ構造。

このデータ構造により、研究者は基盤となるグリッドデータを適切な形式に容易に変換することができ、対応する演算子を用いて最も効率的なデータ表現を適合させることができます。PyTorch3Dは、異なる表現ビューを効率的に切り替えながら、異なるデータ表現のプロパティを取得できる手段をユーザーに提供し、優れた柔軟性を実現します。

3Dデータの効率的な処理

チームは、一般的に使用されるいくつかの演算子の最適化、3D データの損失関数の最適化、異種のバッチデータ入力のサポートなど、いくつかの作業を完了しました。

これにより、ユーザーはこれらの演算子をPyTorch3Dに直接インポートして、より高速な実験が可能になります。これらの演算子には、2つの点群を比較する手法であるChamfer Loss（3Dメッシュの損失関数として使用可能）が含まれます。開発チームはまた、この損失関数向けに、CUDAカーネルを用いて計算負荷の高い最近傍最適化手法も開発しました。

モデリングは、面取り損失とその他のパラメータを収束させることによって実現されます。

微分可能な画像レンダリング手法

3Dモデルを2D画像にレンダリングすることは、この分野の中核を成す技術です。このレンダリング手法では、3Dシーンの属性を2D画像のピクセル情報に変換します。従来のレンダリング手法は一般的に微分不可能であるため、ディープラーニングとの統合が困難でした。微分可能なレンダリング手法は新たな研究分野であり、研究者たちはPyTorch3Dを用いてこれを実現することを目指しています。

3D モデルを 2D 画像に変換するプロセス。

このプロジェクトでは、研究者らは高効率でモジュール化された微分可能なレンダラーを採用しました。さらに、これらのレンダラーは拡張性に優れているため、レンダリング中に照明や影の効果を変更するなど、ユーザーが簡単にカスタマイズできます。計算負荷の高いモデルからピクセルへの変換段階では、PyTorch、C++、CUDA間で並列処理を行い、その精度を包括的にテストできます。他のPyTorch3D演算子と同様に、このレンダラーは異種バッチデータもサポートします。

ユーザーガイド

プロジェクトの研究者は、ブログでプロジェクトを紹介するだけでなく、関連するチュートリアルも 4 つ提供しました。

球状のポイントクラウドをイルカに分解する: https://github.com/facebookresearch/pytorch3d/blob/master/docs/tutorials/deform_source_mesh_to_target_mesh.ipynb

マテリアルを使用したポイントクラウドのレンダリング: https://github.com/facebookresearch/pytorch3d/blob/master/docs/tutorials/render_textured_meshes.ipynb

メッシュ調整: https://github.com/facebookresearch/pytorch3d/blob/master/docs/tutorials/bundle_adjustment.ipynb

カメラ位置の最適化: https://github.com/facebookresearch/pytorch3d/blob/master/docs/tutorials/camera_position_optimization_with_differentiable_rendering.ipynb

DUICUO

FacebookがPyTorch3Dをオープンソース化：PyTorchベースの新しい3Dコンピュータビジョンライブラリ

関連するおすすめ記事

ランダムにおすすめされた記事

人気のタグ