Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

Back TranScription(BTS)기반 데이터 구축 검증 연구A Study on Verification of Back TranScription(BTS)-based Data Construction

Other Titles
A Study on Verification of Back TranScription(BTS)-based Data Construction
Authors
박찬준서재형이설화문현석어수경임희석
Issue Date
2021
Publisher
한국융합학회
Keywords
BackTranScription; BackTranscription; Deep learning; Language convergence; Machine translation; Parallel corpus; Speech recognition; 기계번역; 딥러닝; 병렬말뭉치; 언어융합; 음성인식
Citation
한국융합학회논문지, v.12, no.11, pp.109 - 117
Indexed
KCI
Journal Title
한국융합학회논문지
Volume
12
Number
11
Start Page
109
End Page
117
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/138312
DOI
10.15207/JKCS.2021.12.11.109
ISSN
2233-4890
Abstract
최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
Graduate School > Department of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE