병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 문현석 | - |
dc.contributor.author | 박찬준 | - |
dc.contributor.author | 어수경 | - |
dc.contributor.author | 박정배 | - |
dc.contributor.author | 임희석 | - |
dc.date.accessioned | 2021-12-03T06:41:22Z | - |
dc.date.available | 2021-12-03T06:41:22Z | - |
dc.date.created | 2021-08-31 | - |
dc.date.issued | 2021-05 | - |
dc.identifier.issn | 2233-4890 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/129059 | - |
dc.description.abstract | 최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국융합학회 | - |
dc.title | 병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구 | - |
dc.title.alternative | Filter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 박정배 | - |
dc.contributor.affiliatedAuthor | 임희석 | - |
dc.identifier.doi | 10.15207/JKCS.2021.12.5.001 | - |
dc.identifier.bibliographicCitation | 한국융합학회논문지, v.12, no.5, pp.1 - 7 | - |
dc.relation.isPartOf | 한국융합학회논문지 | - |
dc.citation.title | 한국융합학회논문지 | - |
dc.citation.volume | 12 | - |
dc.citation.number | 5 | - |
dc.citation.startPage | 1 | - |
dc.citation.endPage | 7 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002718444 | - |
dc.description.journalClass | 2 | - |
dc.description.isOpenAccess | N | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | 딥러닝 | - |
dc.subject.keywordAuthor | 자연어처리 | - |
dc.subject.keywordAuthor | 기계번역 | - |
dc.subject.keywordAuthor | 병렬 말뭉치 필터링 | - |
dc.subject.keywordAuthor | 사전학습 모델 | - |
dc.subject.keywordAuthor | Deep Learning | - |
dc.subject.keywordAuthor | Natural Language Process | - |
dc.subject.keywordAuthor | Machine Translation | - |
dc.subject.keywordAuthor | Parallel Corpus Filtering | - |
dc.subject.keywordAuthor | Pretrained model | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.