본 발명은 미리 학습된 인공 신경망으로 구현되고, 인가된 2D 이미지에 대해 신경망 연산을 수행하여 2D 이미지에서 인간의 신체 중 기지정된 다수의 주요 관절의 2D 위치를 추정하여 2D 자세를 추정하는 2D 자세 추정부 및 미리 학습된 인공 신경망으로 구현되고, 2D 자세를 인가받아 신경망 연산을 수행하여 다수의 주요 관절 각각의 깊이 정보를 추정하여 3D 자세를 획득하는 3D 자세 추정부를 포함하되, 3D 자세 추정부는 학습 데이터의 학습 2D 이미지에 대해 사전에 별도의 방식으로 획득되어 레이블된 3D 자세인 기준 자세와 학습 2D 이미지로부터 추정된 3D 자세인 추정 자세 각각에서 획득되는 다수의 주요 관절들 중 중심 관절에 대해 다른 주요 관절들이 위치한 각도와 거리에 대한 오차와 신체의 부위별 주요 관절들 사이의 상대 각도에 대한 오차 및 인접한 주요 관절들 사이의 거리에 따른 오차의 가중합에 따른 공간적 손실을 기반으로 학습되어 인간 인지적 측면에서 실제와 유사한 3D 자세를 추정할 수 있으며, 대해 시간적 연속성이 고려되도록 함으로써 자연스러운 움직임을 갖는 3D 자세를 추정할 수 있는 3D 자세 추정 장치 및 방법을 제공한다.