본 발명은 VR 콘텐츠를 구성하는 VR 영상에 포함된 다수의 프레임을 인가받아 미리 학습된 신경망 연산 방식에 따라 각 프레임의 특징을 추출하여 다수의 특징맵을 획득하고, 다수의 특징맵 각각에 각 프레임의 중요도를 나타내는 어텐션 가중치를 가중하여 다수의 가중 특징맵을 획득하는 어텐션 프레임 특징 추출부, 다수의 가중 특징맵이 결합된 결합 특징맵을 인가받아, 미리 학습된 신경망 연산 방식에 따라 결합 특징맵이 기지정된 개수의 클래스 각각에 대응하는 수준을 분석하여 다수의 클래스 각각에 대한 다수의 가중 특징맵의 서로 다른 기여도가 반영된 결합 클래스 특징맵을 획득하고, 학습에 의해 미리 설정된 클래스 가중치를 가중하여 VR 영상에 대한 VIMS 점수를 나타내는 클래스 확률을 판별하는 콘텐츠 평가부 및 결합 클래스 특징맵의 다수의 가중 클래스 특징맵에서 추출되는 클래스 특징맵 각각에 클래스 가중치를 가중하고 모든 클래스에 대해 누산하여, 다수의 프레임 각각에 대한 VIMS를 나타내는 프레임 VIMS를 획득하는 프레임 VIMS 예측부를 포함하여, VR 콘텐츠 영상에 의한 VIMS 점수를 프레임 단위로 정량적으로 예측할 수 있으므로, VR 콘텐츠 개발 비용 및 시간을 크게 저감시킬 수 있도록 하는 가상현실 콘텐츠 멀미 및 어지러움 예측 장치 및 방법을 제공한다.