생성 모델과 검색 모델을 이용한 한국어 멀티턴 응답 생성 연구A study on Korean multi-turn response generation using generative and retrieval model
- Other Titles
- A study on Korean multi-turn response generation using generative and retrieval model
- Authors
- 이호동; 이종민; 서재형; 장윤나; 임희석
- Issue Date
- 2022
- Publisher
- 한국융합학회
- Keywords
- Conversation; Language model; Multi-turn; Natural language generation; 대화; 멀티턴; 발화 생성; 언어 모델; 자연어 생성
- Citation
- 한국융합학회논문지, v.13, no.1, pp.13 - 21
- Indexed
- KCI
- Journal Title
- 한국융합학회논문지
- Volume
- 13
- Number
- 1
- Start Page
- 13
- End Page
- 21
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/138962
- DOI
- 10.15207/JKCS.2022.13.01.013
- ISSN
- 2233-4890
- Abstract
- 최근 딥러닝 기반의 자연어처리 연구는 사전 훈련된 언어 모델을 통해 대부분의 자연어처리 분야에서 우수한 성능을 보인다. 특히 오토인코더 (auto-encoder) 기반의 언어 모델은 다양한 한국어 이해 분야에서 뛰어난 성능과 쓰임을 증명하고 있다. 그러나 여전히 디코더 (decoder) 기반의 한국어 생성 모델은 간단한 문장 생성 과제에도 어려움을 겪고 있으며, 생성 모델이 가장 일반적으로 쓰이는 대화 분야에서의 세부 연구와 학습 가능한 데이터가 부족한 상황이다. 따라서 본 논문은 한국어 생성 모델을 위한 멀티턴 대화 데이터를 구축하고 전이 학습을 통해 생성 모델의 대화 능력을 개선하여 성능을 비교 분석한다. 또한, 검색 모델을 통해 외부 지식 정보에서 추천 응답 후보군을 추출하여 모델의 부족한 대화 생성 능력을 보완하는 방법을 제안한다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.