이 장에서는 MMPose의 전체 프레임워크를 소개하고 자세한 튜토리얼로 연결되는 링크를 제공한다.
What is MMPose
MMPose는 Pytorch 기반의 포즈 추정 오픈소스 툴킷으로, OpenMMLab 프로젝트의 일원이다. 이 툴킷은 2D 다인 포즈 추정, 2D 손 포즈 추정, 2D 얼굴 랜드마크 감지, 133 키포인트 전신 포즈 추정, 패션 랜드마크 감지 및 동물 포즈 추정과 관련된 다양한 알고리즘과 모듈을 포함하고 있다. 아래는 MMPose의 전체 프레임워크이다.
MMPose는 8개의 주요 구성 요소로 구성되어 있다:
- apis: 모델 추론을 위한 고수준 API를 제공한다.
- structures: bbox, keypoint 및 PoseDataSample과 같은 데이터 구조를 제공한다.
- datasets: 포즈 추정을 위한 다양한 데이터셋을 지원한다.
- transforms: 유용한 데이터 증강 변환을 많이 포함하고 있다.
- codecs: 포즈 인코더와 디코더를 제공한다. 인코더는 포즈(주로 키포인트)를 학습 목표(예: 히트맵)로 인코딩하고, 디코더는 모델 출력을 포즈 예측으로 디코딩한다.
- models: 모듈형 구조로 포즈 추정 모델의 모든 구성 요소를 제공한다.
- pose_estimators: 모든 포즈 추정 모델 클래스를 정의한다.
- data_preprocessors: 모델의 입력 데이터를 전처리한다.
- backbones: 백본 네트워크 모음을 제공한다.
- necks: 다양한 넥 모듈을 포함한다.
- heads: 포즈 추정을 수행하는 다양한 예측 헤드를 포함한다.
- losses: 다양한 손실 함수를 포함한다.
- engine: 포즈 추정과 관련된 런타임 구성 요소를 제공한다.
- hooks: 러너의 다양한 훅을 제공한다.
- evaluation: 모델 성능 평가를 위한 지표를 제공한다.
- visualization: 스켈레톤, 히트맵 및 기타 정보를 시각화한다.
https://mmpose.readthedocs.io/en/latest/overview.html
'OpenMMLab > MMPose' 카테고리의 다른 글
[MMPose] A 20-MINUTE TOUR TO MMPOSE (0) | 2024.06.22 |
---|---|
[MMPose] Installation (0) | 2024.06.14 |