20 likes | 359 Views
대규모 검색 : Lucene 과 Solr. Search Engine 이란 ? 문서 Index 구성 후 이를 이용해 검색 Indexing 절차 : 문서변환 > Metadata 추출 > 텍스트 정규화 > (inverted) index 기록 Apache Lucene 및 관련 프로젝트 Lucene Java 2.2 = indexing 및 검색 용 Java 라이브러리
E N D
대규모 검색: Lucene과 Solr • Search Engine이란? • 문서 Index 구성 후 이를 이용해 검색 • Indexing 절차: 문서변환 > Metadata추출 > 텍스트 정규화 > (inverted) index 기록 • Apache Lucene및 관련 프로젝트 • Lucene Java 2.2 = indexing 및 검색 용 Java 라이브러리 • Solr 1.2 = http 기반의 index 및 검색 서버 (Web Application) • Nutch 0.9 = Internet search engine software • Hadoop = 분산컴퓨팅 플랫폼 (Map/Reduce)