본 개시의 일 실시예에 따르면, 문자열 교정 기반의 유사 구조 분자 생성 모델 학습 방법은, 학습 데이터셋에 포함된 소스 분자 및 학습 데이터셋에서 소스 분자와 사전 페어링(paring)된 목표 분자의 문자열 각각에 대해 토큰화를 수행하여 소스 문자열 조각 세트 및 목표 문자열 조각 세트를 획득하는 단계, 소스 문자열 조각 세트 및 목표 문자열 조각 세트를 제1 학습 모델에 입력하여 소스 문자열 조각 세트가 임베딩된 소스 임베딩 조각 세트 및 목표 문자열 조각 세트가 임베딩된 목표 임베딩 조각 세트를 획득하는 및 소스 임베딩 조각 세트 및 목표 임베딩 조각 세트를 제2 학습 모델에 입력하여, 소스 임베딩 조각 세트에서 하나 이상의 임베딩 조각이 수정된 최종 임베딩 조각 세트를 출력하도록 제2 학습 모델을 학습시키는 단계를 포함할 수 있다.