Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구

Full metadata record
DC Field Value Language
dc.contributor.author문현석-
dc.contributor.author박찬준-
dc.contributor.author어수경-
dc.contributor.author박정배-
dc.contributor.author임희석-
dc.date.accessioned2021-12-03T06:41:22Z-
dc.date.available2021-12-03T06:41:22Z-
dc.date.created2021-08-31-
dc.date.issued2021-05-
dc.identifier.issn2233-4890-
dc.identifier.urihttps://scholar.korea.ac.kr/handle/2021.sw.korea/129059-
dc.description.abstract최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다.-
dc.languageKorean-
dc.language.isoko-
dc.publisher한국융합학회-
dc.title병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구-
dc.title.alternativeFilter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering-
dc.typeArticle-
dc.contributor.affiliatedAuthor박정배-
dc.contributor.affiliatedAuthor임희석-
dc.identifier.doi10.15207/JKCS.2021.12.5.001-
dc.identifier.bibliographicCitation한국융합학회논문지, v.12, no.5, pp.1 - 7-
dc.relation.isPartOf한국융합학회논문지-
dc.citation.title한국융합학회논문지-
dc.citation.volume12-
dc.citation.number5-
dc.citation.startPage1-
dc.citation.endPage7-
dc.type.rimsART-
dc.identifier.kciidART002718444-
dc.description.journalClass2-
dc.description.isOpenAccessN-
dc.description.journalRegisteredClasskci-
dc.subject.keywordAuthor딥러닝-
dc.subject.keywordAuthor자연어처리-
dc.subject.keywordAuthor기계번역-
dc.subject.keywordAuthor병렬 말뭉치 필터링-
dc.subject.keywordAuthor사전학습 모델-
dc.subject.keywordAuthorDeep Learning-
dc.subject.keywordAuthorNatural Language Process-
dc.subject.keywordAuthorMachine Translation-
dc.subject.keywordAuthorParallel Corpus Filtering-
dc.subject.keywordAuthorPretrained model-
Files in This Item
There are no files associated with this item.
Appears in
Collections
Graduate School > Department of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE