한국어 인공신경망 기계번역의 서브 워드 분절 연구 및 음절 기반 종성 분리 토큰화 제안
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 어수경 | - |
dc.contributor.author | 박찬준 | - |
dc.contributor.author | 문현석 | - |
dc.contributor.author | 임희석 | - |
dc.date.accessioned | 2021-12-06T14:41:58Z | - |
dc.date.available | 2021-12-06T14:41:58Z | - |
dc.date.created | 2021-08-31 | - |
dc.date.issued | 2021 | - |
dc.identifier.issn | 2233-4890 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/129868 | - |
dc.description.abstract | 인공신경망 기계번역(Neural Machine Translation, NMT)은 한정된 개수의 단어만을 번역에 이용하기 때문에 사전에 등록되지 않은 단어들이 입력으로 들어올 가능성이 있다. 이러한 Out of Vocabulary(OOV) 문제를 완화하고자 고안된 방법이 서브 워드 분절(Subword Tokenization)이며, 이는 문장을 단어보다 더 작은 서브 워드 단위로 분할하여 단어를 구성하는 방법론이다. 본 논문에서는 일반적인 서브 워드 분절 알고리즘들을 다루며, 나아가 한국어의 무한한 용언 활용을 잘 다룰 수 있는 사전을 만들기 위해 한국어의 음절 중 종성을 분리하여 서브 워드 분절을 학습하는 새로운 방법론을 제안한다. 실험결과 본 논문에서 제안하는 방법론이 기존의 서브 워드 분리 방법론보다 높은 성능을 거두었다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국융합학회 | - |
dc.title | 한국어 인공신경망 기계번역의 서브 워드 분절 연구 및 음절 기반 종성 분리 토큰화 제안 | - |
dc.title.alternative | Research on Subword Tokenization of Korean Neural Machine Translation and Proposal for Tokenization Method to Separate Jongsung from Syllables | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 임희석 | - |
dc.identifier.doi | 10.15207/JKCS.2021.12.3.001 | - |
dc.identifier.bibliographicCitation | 한국융합학회논문지, v.12, no.3, pp.1 - 7 | - |
dc.relation.isPartOf | 한국융합학회논문지 | - |
dc.citation.title | 한국융합학회논문지 | - |
dc.citation.volume | 12 | - |
dc.citation.number | 3 | - |
dc.citation.startPage | 1 | - |
dc.citation.endPage | 7 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002696269 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | Machine Translation | - |
dc.subject.keywordAuthor | Preprocessing | - |
dc.subject.keywordAuthor | Subword Tokenization | - |
dc.subject.keywordAuthor | Subword | - |
dc.subject.keywordAuthor | Deep Learning | - |
dc.subject.keywordAuthor | Convergence | - |
dc.subject.keywordAuthor | 기계번역 | - |
dc.subject.keywordAuthor | 전처리 | - |
dc.subject.keywordAuthor | 서브 워드 분절 | - |
dc.subject.keywordAuthor | 서브 워드 | - |
dc.subject.keywordAuthor | 딥러닝 | - |
dc.subject.keywordAuthor | 융합 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.