首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Carrot2聚类的垂直搜索引擎的研究与实现
引用本文:高 凯,阳春辉,陶秋红,张 洋,杨军伟.基于Carrot2聚类的垂直搜索引擎的研究与实现[J].河北工业科技,2012,29(3):155-157.
作者姓名:高 凯  阳春辉  陶秋红  张 洋  杨军伟
作者单位:1. 河北科技大学信息科学与工程学院,河北石家庄,050018
2. 石家庄职工大学,河北石家庄,050041
3. 北京首都国际机场,北京,100621
基金项目:河北省科技支撑计划项目
摘    要:给出了一个基于Nutch的垂直搜索引擎系统的实现,主要探讨了基于Lucene和Carrot2的信息检索与聚类的实现,并对分词、垂直信息采集等的实现进行了说明。

关 键 词:搜索引擎  Lucene  Nutch  分词  聚类
收稿时间:2012/3/2 0:00:00

Research and implementation of vertical search engine based on Carrot2clustering
GAO Kai,YANG Chun-hui,TAO Qiu-hong,ZHANG Yang and YANG Jun-wei.Research and implementation of vertical search engine based on Carrot2clustering[J].Hebei Journal of Industrial Science & Technology,2012,29(3):155-157.
Authors:GAO Kai  YANG Chun-hui  TAO Qiu-hong  ZHANG Yang and YANG Jun-wei
Institution:1 (1.College of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang Hebei 050018,China;2.Shijiazhuang Staff and Workers University,Shijiazhuang Hebei 050041,China;3.Beijing Capital International Airport,Beijing 100621,China)
Abstract:This paper presents the implementation of vertical search engine based on Nutch,mainly the implementation of the Lucene and the Carrot2 for information retrieval and clustering.Moreover,the paper also introduces in some details the Chinese word segmentation and data collection.
Keywords:search engine  Lucene  Nutch  Chinese word segmentation  clustering
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《河北工业科技》浏览原始摘要信息
点击此处可从《河北工业科技》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号