본문 바로가기
OpenMMLab/MMPose

[MMPose] Overview

by Lizardee 2024. 6. 22.

이 장에서는 MMPose의 전체 프레임워크를 소개하고 자세한 튜토리얼로 연결되는 링크를 제공한다.

 

What is MMPose

MMPose는 Pytorch 기반의 포즈 추정 오픈소스 툴킷으로, OpenMMLab 프로젝트의 일원이다. 이 툴킷은 2D 다인 포즈 추정, 2D 손 포즈 추정, 2D 얼굴 랜드마크 감지, 133 키포인트 전신 포즈 추정, 패션 랜드마크 감지 및 동물 포즈 추정과 관련된 다양한 알고리즘과 모듈을 포함하고 있다. 아래는 MMPose의 전체 프레임워크이다.

 

MMPose는 8개의 주요 구성 요소로 구성되어 있다:

  • apis: 모델 추론을 위한 고수준 API를 제공한다.
  • structures: bbox, keypoint 및 PoseDataSample과 같은 데이터 구조를 제공한다.
  • datasets: 포즈 추정을 위한 다양한 데이터셋을 지원한다.
    • transforms: 유용한 데이터 증강 변환을 많이 포함하고 있다.
  • codecs: 포즈 인코더와 디코더를 제공한다. 인코더는 포즈(주로 키포인트)를 학습 목표(예: 히트맵)로 인코딩하고, 디코더는 모델 출력을 포즈 예측으로 디코딩한다.
  • models: 모듈형 구조로 포즈 추정 모델의 모든 구성 요소를 제공한다.
    • pose_estimators: 모든 포즈 추정 모델 클래스를 정의한다.
    • data_preprocessors: 모델의 입력 데이터를 전처리한다.
    • backbones: 백본 네트워크 모음을 제공한다.
    • necks: 다양한 넥 모듈을 포함한다.
    • heads: 포즈 추정을 수행하는 다양한 예측 헤드를 포함한다.
    • losses: 다양한 손실 함수를 포함한다.
  • engine: 포즈 추정과 관련된 런타임 구성 요소를 제공한다.
    • hooks: 러너의 다양한 훅을 제공한다.
  • evaluation: 모델 성능 평가를 위한 지표를 제공한다.
  • visualization: 스켈레톤, 히트맵 및 기타 정보를 시각화한다.

 

 


https://mmpose.readthedocs.io/en/latest/overview.html

 

'OpenMMLab > MMPose' 카테고리의 다른 글

[MMPose] A 20-MINUTE TOUR TO MMPOSE  (0) 2024.06.22
[MMPose] Installation  (0) 2024.06.14