발화 의도 예측 및 슬롯 채우기 복합 처리를 위한 한국어 데이터셋 개발Development of Korean dataset for joint intent classification and slot filling
- Other Titles
- Development of Korean dataset for joint intent classification and slot filling
- Authors
- 한승규; 임희석
- Issue Date
- 2021
- Publisher
- 한국융합학회
- Keywords
- 자연어처리; 발화 이해; 발화 의도 예측; 슬롯 채우기; 데이터셋; BERT; Natural Language Processing; Spoken Language Understanding; Intent Classification; Slot Filling; Dataset; BERT
- Citation
- 한국융합학회논문지, v.12, no.1, pp.57 - 63
- Indexed
- KCI
- Journal Title
- 한국융합학회논문지
- Volume
- 12
- Number
- 1
- Start Page
- 57
- End Page
- 63
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/50695
- DOI
- 10.15207/JKCS.2021.12.1.057
- ISSN
- 2233-4890
- Abstract
- 사람의 발화 내용을 이해하도록 하는 언어 인식 시스템은 주로 영어로 연구되어 왔다. 본 논문에서는 시스템과 사용자의 대화 내용을 수집한 말뭉치를 바탕으로 언어 인식 시스템을 훈련시키고 평가할 때 사용할 수 있는 한국어 데이터셋을 개발하고, 관련 통계를 제시한다. 본 데이터셋은 식당 예약이라는 고정된 주제 안에서 사용자의 발화 의도와 슬롯 채우기를 해야 하는 데이터셋이다. 본 데이터셋은 6857개의 한국어 문장으로 이루어져 있으며, 표기된 단어 슬롯의 종류는 총 7개이다. 본 데이터셋에서 표기된 발화의 종류는 총 5개이며, 문장의 발화 내용에 따라 최대 2개까지 동시에 기입되어 있다. 영어권에서 연구된 모델을 본 데이터셋에 적용시켜 본 결과, 발화 의도 추측 정확도는 조금 하락하였고, 슬롯 채우기 F1 점수는 크게 차이나는 모습을 보였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.