Back TranScription(BTS)기반 데이터 구축 검증 연구A Study on Verification of Back TranScription(BTS)-based Data Construction
- Other Titles
- A Study on Verification of Back TranScription(BTS)-based Data Construction
- Authors
- 박찬준; 서재형; 이설화; 문현석; 어수경; 임희석
- Issue Date
- 2021
- Publisher
- 한국융합학회
- Keywords
- BackTranScription; BackTranscription; Deep learning; Language convergence; Machine translation; Parallel corpus; Speech recognition; 기계번역; 딥러닝; 병렬말뭉치; 언어융합; 음성인식
- Citation
- 한국융합학회논문지, v.12, no.11, pp.109 - 117
- Indexed
- KCI
- Journal Title
- 한국융합학회논문지
- Volume
- 12
- Number
- 11
- Start Page
- 109
- End Page
- 117
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/138312
- DOI
- 10.15207/JKCS.2021.12.11.109
- ISSN
- 2233-4890
- Abstract
- 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.