한국어-영어 법률 말뭉치의 로컬 이중 언어 임베딩
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 최순영 | - |
dc.contributor.author | Andrew Stuart Matteson | - |
dc.contributor.author | 임희석 | - |
dc.date.accessioned | 2021-09-02T18:00:36Z | - |
dc.date.available | 2021-09-02T18:00:36Z | - |
dc.date.created | 2021-06-17 | - |
dc.date.issued | 2018 | - |
dc.identifier.issn | 2233-4890 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/79018 | - |
dc.description.abstract | 최근 이중 언어 임베딩(bilingual word embedding) 관련 연구들이 각광을 받고 있다. 그러나 한국어와 특정 언어로 구성된 병렬(parallel-aligned) 말뭉치로 이중 언어 워드 임베딩을 하는 연구는 질이 높은 많은 양의 말뭉치를 구하기 어려우므로 활발히 이루어지지 않고 있다. 특히, 특정 영역에 사용할 수 있는 로컬 이중 언어 워드 임베딩(local bilingual word embedding)의 경우는 상대적으로 더 희소하다. 또한 이중 언어 워드 임베딩을 하는 경우 번역 쌍이 단어의 개수에서 일대일 대응을 이루지 못하는 경우가 많다. 본 논문에서는 로컬 워드 임베딩을 위해 한국어-영어로 구성된 한국 법률 단락 868,163개를 크롤링(crawling)하여 임베딩을 하였고 3가지 연결 전략을 제안하였다. 본 전략은 앞서 언급한 불규칙적 대응 문제를 해결하고 단락 정렬 말뭉치에서 번역 쌍의 질을 향상시켰으며 베이스라인인 글로벌 워드 임베딩(global bilingual word embedding)과 비교하였을 때 2배의 성능을 확인하였다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국융합학회 | - |
dc.title | 한국어-영어 법률 말뭉치의 로컬 이중 언어 임베딩 | - |
dc.title.alternative | Utilizing Local Bilingual Embeddings on Korean-English Law Data | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 임희석 | - |
dc.identifier.doi | 10.15207/JKCS.2018.9.10.045 | - |
dc.identifier.bibliographicCitation | 한국융합학회논문지, v.9, no.10, pp.45 - 53 | - |
dc.relation.isPartOf | 한국융합학회논문지 | - |
dc.citation.title | 한국융합학회논문지 | - |
dc.citation.volume | 9 | - |
dc.citation.number | 10 | - |
dc.citation.startPage | 45 | - |
dc.citation.endPage | 53 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002396258 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | 이중 언어 워드 임베딩 | - |
dc.subject.keywordAuthor | 자연어처리 | - |
dc.subject.keywordAuthor | 영역 특수적 | - |
dc.subject.keywordAuthor | 법률 영역 | - |
dc.subject.keywordAuthor | 단어집 | - |
dc.subject.keywordAuthor | 반지도 학습 | - |
dc.subject.keywordAuthor | 단락 정렬 | - |
dc.subject.keywordAuthor | 단어 유사도 | - |
dc.subject.keywordAuthor | skip-gram | - |
dc.subject.keywordAuthor | 로컬 임베딩 | - |
dc.subject.keywordAuthor | Bilingual word embedding | - |
dc.subject.keywordAuthor | natural language processing | - |
dc.subject.keywordAuthor | domain-specific | - |
dc.subject.keywordAuthor | law domain | - |
dc.subject.keywordAuthor | dictionary seed | - |
dc.subject.keywordAuthor | semi-supervised training | - |
dc.subject.keywordAuthor | paragraph-aligned | - |
dc.subject.keywordAuthor | word similarity | - |
dc.subject.keywordAuthor | skip-gram | - |
dc.subject.keywordAuthor | local embedding | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.