텍스트 마이닝을 이용한 특허정보검색 개발에 관한 연구A Study on Development of Patent Information Retrieval Using Textmining
- Other Titles
- A Study on Development of Patent Information Retrieval Using Textmining
- Authors
- 고광수; 정원교; 신영근; 박상성; 장동식
- Issue Date
- 2011
- Publisher
- 한국산학기술학회
- Keywords
- Text Mining; TF-IDF; Precision; Stop-word; Patent Information Retrieval; Text Mining; TF-IDF; Precision; Stop-word; Patent Information Retrieval
- Citation
- 한국산학기술학회논문지, v.12, no.8, pp.3677 - 3688
- Indexed
- KCI
- Journal Title
- 한국산학기술학회논문지
- Volume
- 12
- Number
- 8
- Start Page
- 3677
- End Page
- 3688
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/114473
- ISSN
- 1975-4701
- Abstract
- 특허정보검색의 목적은 다양한 목적성을 지니고 있다. 일반적으로 특허정보검색은 제한된 키워드들에 의한 검색으로 이루어지며, 선행 특허권과 유사특허를 파악하기 위하여 반복적인 검색과 검토의 노력이 필요하다. 본 논문에서는 특허문서의 전체 텍스트를 분석하여 특징치를 찾아내는 내용기반 검색방법을 제안하고 검색결과를 질의문서와 유사한 문서 순으로 우선 배치하여 검색에 효율을 높일 수 있는 방법을 제안한다. 즉, 제안된 알고리즘은 텍스트 분석과정을 통해 각 문서별로 특징치가 부여되고 문서 간 특징치 비교를 통해 유사문서를 찾고 문서를 랭킹하여 유사정보를 제공한다. 텍스트 분석과정은 Stop-word과정, 핵심단어 추출과정, 핵심단어 가중치 산출 과정으로 이루어진다. 실험결과에서는 정확도 측정을 실시하여 일반검색엔진과 본 논문에서 제안한 알고리즘의 검색 정확도를 비교하였다. 본 논문은 검색결과를 질의한 문서와 유사한 문서 순으로 랭킹하기 때문에 검색이용자가 검색결과 검토과정에서 유사한 문서를 먼저 검토할 수 있도록 하여 검토시간을 줄이고 검색의 효율을 높일 수 있다. 또한 특허문서 전체 텍스트를 입력받아 사용하기 때문에 특허검색에 익숙하지 않는 이용자도 검색을 쉽고 빠르게 이용할 수 있다. 그리고 내용 기반 검색이 이루어지기 때문에 키워드 및 검색 식을 이용하는 방법보다 검색범위를 넓힐 수 있어서 검색에 누락되는 데이터를 줄일 수 있는 효과를 가진다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Graduate School of management of technology > 1. Journal Articles
- College of Engineering > School of Industrial and Management Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.