Back TranScription(BTS)기반 데이터 구축 검증 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 박찬준 | - |
dc.contributor.author | 서재형 | - |
dc.contributor.author | 이설화 | - |
dc.contributor.author | 문현석 | - |
dc.contributor.author | 어수경 | - |
dc.contributor.author | 임희석 | - |
dc.date.accessioned | 2022-03-09T05:41:56Z | - |
dc.date.available | 2022-03-09T05:41:56Z | - |
dc.date.created | 2022-02-10 | - |
dc.date.issued | 2021 | - |
dc.identifier.issn | 2233-4890 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/138312 | - |
dc.description.abstract | 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국융합학회 | - |
dc.title | Back TranScription(BTS)기반 데이터 구축 검증 연구 | - |
dc.title.alternative | A Study on Verification of Back TranScription(BTS)-based Data Construction | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 임희석 | - |
dc.identifier.doi | 10.15207/JKCS.2021.12.11.109 | - |
dc.identifier.bibliographicCitation | 한국융합학회논문지, v.12, no.11, pp.109 - 117 | - |
dc.relation.isPartOf | 한국융합학회논문지 | - |
dc.citation.title | 한국융합학회논문지 | - |
dc.citation.volume | 12 | - |
dc.citation.number | 11 | - |
dc.citation.startPage | 109 | - |
dc.citation.endPage | 117 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002777675 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | BackTranScription | - |
dc.subject.keywordAuthor | BackTranscription | - |
dc.subject.keywordAuthor | Deep learning | - |
dc.subject.keywordAuthor | Language convergence | - |
dc.subject.keywordAuthor | Machine translation | - |
dc.subject.keywordAuthor | Parallel corpus | - |
dc.subject.keywordAuthor | Speech recognition | - |
dc.subject.keywordAuthor | 기계번역 | - |
dc.subject.keywordAuthor | 딥러닝 | - |
dc.subject.keywordAuthor | 병렬말뭉치 | - |
dc.subject.keywordAuthor | 언어융합 | - |
dc.subject.keywordAuthor | 음성인식 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.