代表技術通信~PointNetを使い倒す②
こんばんは。代表の草場です。
PointNetに関しての第二回です。PointNetに関してまとめている論文、Deep Learning for 3D Point Clouds: A Survey、を読み始めました。これがもう一年前です。この一年でさらに加速しているはず。
概要
点群学習は、コンピュータのような幅広い分野での応用が期待されており、近年注目を集めています。コンピュータービジョン、自動運転、ロボティクスなどの分野で活躍しています。AIにおける圧倒的な技術として、ディープラーニングは様々な問題解決に成功しています。点群上の深層学習は、処理に特有の課題があるため、まだ黎明期の段階です。最近では,点群の深層学習がさらに盛んになってきており、多くの手法が開発されています。本論文では、点群の検出と追跡、3D点群セグメンテーションなどを紹介しています。また、公開されているいくつかのデータセットでの比較結果も紹介しています。洞察力に富んだ観察と今後の研究の方向性を示唆するものです。
包括的な経験を学べますね。
1 序論
3Dデータ取得技術の急速な発展に伴い、3Dセンサーは様々なタイプの3Dスキャナーを含め、ますます利用可能で手頃な価格になってきています。LiDAR、RGB-Dカメラ(Kinect、RealSenseなど Apple社のデプスカメラ)などです。これらのセンサーで取得した3Dデータ は、豊富な幾何学的、形状、スケール情報を提供することができます。2D画像を補完することで,3Dデータは周囲の環境の理解を深めることが出来ます。3Dデータは、自動運転をはじめとする様々な分野で多くの応用があります。ロボット工学、リモートセンシング、医療、デザイン業界といった分野でもです。3Dデータは通常、深度画像、点群、メッシュ、および ボリュームグリッドを使用しています。一般的に使用されるフォーマットとして、点群表現は元の幾何学的情報を離散化せず保持して、3次元空間で表現することができます。したがって、点群表現は自動運転やロボット工学などのシーン理解に関連する多くのアプリケーションで好まれている表現です。
点群への期待が高まります。
最近では、ディープラーニング技術が多くの分野、コンピュータビジョン、音声認識などの研究分野、自然言語処理(NLP)、バイオインフォマティクスなどで使われている。しかし、3D点群上でのディープラーニングは、まだいくつかの問題に直面しています。データセットの小規模化などの重要な課題があります。
いくつかの公開されているデータセットがありますModelNet、ShapeNet、ScanNet、Semantic3D 、およびKITTI Vision Benchmark Suiteがあります。これらのデータセット は、3Dのディープラーニングの研究をさらに後押ししています。ますます多くのメソッドがが提案されています。3次元形状分類、3次元オブジェクトを含む処理 の検出と追跡、3D点群セグメンテーションなどがある。
3次元データセット、調べてみます。
3次元データに対するディープラーニングの調査も少ないです。この論文は点群のためのディープラーニング手法に特化していますまた、本論文では、分類、検出、追跡を含む様々なアプリケーションを包括的にカバーしています。既存の文献と比較して、本研究の主な貢献は以下のようにまとめることができます。
1) 我々の知る限りでは、ディープラーニングを包括的に取り上げた最初の調査論文である。
3D形状分類、3Dオブジェクトを含む、いくつかの重要な点群関連タスクのためのメソッド
2) 既存のレビューとは異なり、特に3次元点群セグメンテーションのためのディープラーニング手法に焦点を当てている。
3) 本論文では、最新かつ先進的な点群上での深層学習の進展に焦点が当たっており、したがって読者に最先端の手法を提供している。
4) 既存手法の包括的な比較 いくつかの公開されているデータセットが提供されています。
楽しみに読みます。
EVENTS