首页 | 本学科首页   官方微博 | 高级检索  
     

基于Web挖掘的信息抽取系统的研究
作者姓名:方少卿  胡学钢
作者单位:[1]合肥工业大学,安徽合肥230009 [2]铜陵职业技术学院,安徽铜陵244000
摘    要:文章讨论了Web挖掘的一些基本概念,针对Web数据的特点提出了一个基于Web挖掘的信息抽取系统的结构模型。模型通过对XML文档的解析生成DOM树,在此基础上,通过对样本页的DOM树的先序遍历生成抽取规则,再以此规则对Web页进行数据抽取,所抽取的数据保存在数据库中,以便利用数据库技术进一步利用这些数据。

关 键 词:Web挖掘  信息抽取  抽取规则
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号