본 발명은 다단계 심층 강화학습을 이용한 3차원 형태-해부학적 기준점 검출 방법 및 장치에 관한 것으로, 본 발명에 따른 방법은 3차원 영상 데이터에 볼륨 렌더링을 수행하여 3차원 볼륨 렌더링 모델 데이터를 생성하는 단계, 상기 3차원 볼륨 렌더링 모델 데이터를 구성하는 2차원 뷰 영상에서 심층 강화학습 에이전트를 이용하여 기준점에 대응하는 2차원 좌표값을 구하고, 상기 2차원 좌표값을 기초로 구해지는 상기 3차원 영상 데이터의 1차원 프로파일을 기초로 상기 기준점에 대응하는 나머지 1차원 좌표값을 구하는 단일-스테이지 DRL 적용 단계 - 상기 1차원 프로파일은 상기 2차원 뷰 영상에 수직이면서 상기 2차원 좌표값에 대응하는 점을 지나는 축에서의 3차원 영상 데이터 값으로 이루어짐 -, 및 상기 3차원 볼륨 렌더링 모델 데이터를 구성하는 2차원 뷰 영상에서 심층 강화학습 에이전트를 이용하여 기준점에 대응하는 2차원 좌표값을 구하고, 상기 구해진 2차원 좌표값을 기초로 정해지는 2차원 뷰 영상에서 심층 강화학습 에이전트를 이용하여 기준점에 대응하는 2차원 좌표값을 구하는 것을 반복하여 기준점을 검출하는 멀티-스테이지 DRL 적용 단계를 포함한다.