데이터 기반 확률론적 최적제어와 근사적 추론 기반 강화학습 방법론에 관한 고찰
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 박주영 | - |
dc.contributor.author | 지승현 | - |
dc.contributor.author | 성기훈 | - |
dc.contributor.author | 허성만 | - |
dc.contributor.author | 박경욱 | - |
dc.date.accessioned | 2021-09-04T21:45:49Z | - |
dc.date.available | 2021-09-04T21:45:49Z | - |
dc.date.created | 2021-06-17 | - |
dc.date.issued | 2015 | - |
dc.identifier.issn | 1976-9172 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/95240 | - |
dc.description.abstract | 최근들어, 확률론적 최적제어(stochastic optimal control) 및 강화학습(reinforcement learning) 분야에서는 데이터를활용하여 준최적 제어 전략을 찾는 문제를 위한 많은 연구 노력이 있어 왔다. 가치함수(value function) 기반 동적 계획법(dynamic programming)으로 최적제어기를 구하는 고전적인 이론은 확률론적 최적 제어 문제를 풀기위해 확고한이론적 근거 아래 확립된바 있다. 하지만, 이러한 고전적 이론은 매우 간단한 경우에만 성공적으로 적용될 수 있다. 그러므로, 엄밀한 수학적 분석 대신에 상태 전이 및 보상 신호 값 등의 관련 데이터를 활용하여 준최적해를 구하고자하는 데이터 기반 현대적 접근 방법들은 실용적인 응용분야에서 특히 매력적이다. 본 논문에서는 확률론적 최적제어전략과 근사적 추론 및 기계학습 기반 데이터 처리 방법을 접목하는 방법론들을 고려한다. 그리고 이러한 고려를 통하여 얻어진 방법론들을 금융공학을 포함한 다양한 응용 분야에 적용하고 그들의 성능을 관찰해보도록 한다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국지능시스템학회 | - |
dc.title | 데이터 기반 확률론적 최적제어와 근사적 추론 기반 강화학습 방법론에 관한 고찰 | - |
dc.title.alternative | Investigations on data-driven stochastic optimal control and approximate-inference-based reinforcement learning methods | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 박주영 | - |
dc.contributor.affiliatedAuthor | 박경욱 | - |
dc.identifier.bibliographicCitation | 한국지능시스템학회 논문지, v.25, no.4, pp.319 - 326 | - |
dc.relation.isPartOf | 한국지능시스템학회 논문지 | - |
dc.citation.title | 한국지능시스템학회 논문지 | - |
dc.citation.volume | 25 | - |
dc.citation.number | 4 | - |
dc.citation.startPage | 319 | - |
dc.citation.endPage | 326 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002018708 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | Data-driven methods. Stochastic optimal control | - |
dc.subject.keywordAuthor | Approximate inference | - |
dc.subject.keywordAuthor | Machine learning | - |
dc.subject.keywordAuthor | Financial engineering | - |
dc.subject.keywordAuthor | 데이터 기반 방법론 | - |
dc.subject.keywordAuthor | 확률론적 최적 제어 | - |
dc.subject.keywordAuthor | 근사추론 | - |
dc.subject.keywordAuthor | 기계학습 | - |
dc.subject.keywordAuthor | 금융공학 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.