모바일 메뉴 닫기
 
전체메뉴
닫기
 

산학협력단

보유 특허 검색

제목
분산 강화 학습 장치 및 방법
출원인
연세대학교 산학협력단
공고일
2021.07.01
출원일
2020.04.24
게시글 내용
 본 발명은 주변 환경에 대한 상태 정보를 인가받고, 이전 학습된 패턴 추정 방식에 따라 상태 정보로부터 수행해야할 동작을 확률적으로 판별하여 나타내는 수행 동작 확률을 추정하는 로컬 신경망, 수행 동작 확률과 중앙 서버로부터 전송된 글로벌 수행 동작 확률로부터 손실값을 추정하여 로컬 신경망을 학습시키는 손실 추정부, 상태 정보와 상태 정보에 대응하여 추정된 수행 동작 확률을 맵핑하여 저장하는 로컬 경험 메모리, 로컬 경험 메모리에 저장된 다수의 상태 정보를 미리 지정된 방식으로 클러스터링하여 대표 상태 정보가 미리 설정된 적어도 하나의 상태 클러스터로 구분하고, 구분된 적어도 하나의 상태 클러스터에 포함되는 상태 정보 각각에 맵핑된 수행 동작 확률로부터 상태 클러스터별 대표 수행 동작 확률을 획득하는 클러스터링부 및 중앙 서버로 전송하기 위해 적어도 하나의 상태 클러스터 각각에 대응하는 대표 상태 정보와 대표 수행 동작 확률을 맵핑하여 저장하는 로컬 프록시 메모리를 포함하여, 통신량을 크게 저감할 뿐만 아니라, 각 에이전트의 개별 정보를 보호할 수 있는 분산 강화 학습 장치 및 방법을 제공할 수 있다. 

분산 강화 학습 장치 및 방법 대표 이미지

첨부
공고전문PDF
  • 자료출처 : KIPRIS (https://www.kipris.or.kr)
  • 키워드(검색어)별, 발명자별 특허(기술), 공개특허 한정 검색 가능
  • 연구분야별 비공개 특허(기술)은 지식재산권 담당자 별도 문의
  • 지식재산권 담당자
  • 관련 문의처
    보유특허 검색 페이지 및 담당자 정보 안내
    특허 출원인 (권리자) 전담부서 연락처
    연세대학교 산학협력단 본교 산학협력단 지식재산팀 지식재산팀 양지혜 팀장
    (02-2123-5138 / jh.yan@yonsei.ac.kr)
    연세대학교 원주산학협력단 원주산학협력단 기술경영팀 기술경영팀 오정환 팀장
    (033-760-5251 ~ 5252 / WJDGHKSA@yonsei.ac.kr)