인공신경망 기계번역에서 말뭉치 간의 균형성을 고려한 성능 향상 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 박찬준 | - |
dc.contributor.author | 박기남 | - |
dc.contributor.author | 문현석 | - |
dc.contributor.author | 어수경 | - |
dc.contributor.author | 임희석 | - |
dc.date.accessioned | 2021-12-06T00:42:02Z | - |
dc.date.available | 2021-12-06T00:42:02Z | - |
dc.date.created | 2021-08-31 | - |
dc.date.issued | 2021 | - |
dc.identifier.issn | 2233-4890 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/129728 | - |
dc.description.abstract | 최근 딥러닝 기반 자연언어처리 연구들은 다양한 출처의 대용량 데이터들을 함께 학습하여 성능을 올리고자 하는 연구들을 진행하고 있다. 그러나 다양한 출처의 데이터를 하나로 합쳐서 학습시키는 방법론은 성능 향상을 막게 될 가능성이 존재한다. 기계번역의 경우 병렬말뭉치 간의 번역투(의역, 직역), 어체(구어체, 문어체, 격식체 등), 도메인 등의 차이로 인하여 데이터 편차가 발생하게 되는데 이러한 말뭉치들을 하나로 합쳐서 학습을 시키게 되면 성능의 악영향을 미칠 수 있다. 이에 본 논문은 기계번역에서 병렬말뭉치 간의 균형성을 고려한 Corpus Weight Balance (CWB) 학습 방법론을 제안한다. 실험결과 말뭉치 간의 균형성을 고려한 모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 더불어 단일 말뭉치로도 고품질의 병렬 말뭉치를 구축할 수 있는 휴먼번역 시장과의 상생이 가능한 말뭉치 구축 프로세스를 추가로 제안한다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국융합학회 | - |
dc.title | 인공신경망 기계번역에서 말뭉치 간의 균형성을 고려한 성능 향상 연구 | - |
dc.title.alternative | A study on performance improvement considering the balance between corpus in Neural Machine Translation | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 임희석 | - |
dc.identifier.doi | 10.15207/JKCS.2021.12.5.023 | - |
dc.identifier.bibliographicCitation | 한국융합학회논문지, v.12, no.5, pp.23 - 29 | - |
dc.relation.isPartOf | 한국융합학회논문지 | - |
dc.citation.title | 한국융합학회논문지 | - |
dc.citation.volume | 12 | - |
dc.citation.number | 5 | - |
dc.citation.startPage | 23 | - |
dc.citation.endPage | 29 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002718447 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | Machine Translation | - |
dc.subject.keywordAuthor | Parallel Corpus | - |
dc.subject.keywordAuthor | Human Translation | - |
dc.subject.keywordAuthor | High Quality Data | - |
dc.subject.keywordAuthor | Deep Learning | - |
dc.subject.keywordAuthor | Language Conversion | - |
dc.subject.keywordAuthor | 기계번역 | - |
dc.subject.keywordAuthor | 병렬말뭉치 | - |
dc.subject.keywordAuthor | 휴먼번역 | - |
dc.subject.keywordAuthor | 고품질 데이터 | - |
dc.subject.keywordAuthor | 딥러닝 | - |
dc.subject.keywordAuthor | 언어융합 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.