首页 | 本学科首页   官方微博 | 高级检索  
     

基于R语言的WEB半结构化数据抓取与统计分析
引用本文:邓远飞,甄晓云,孟捷. 基于R语言的WEB半结构化数据抓取与统计分析[J]. 价值工程, 2016, 0(5): 232-234
作者姓名:邓远飞  甄晓云  孟捷
作者单位:昆明理工大学;云南大学
基金项目:“基于WEB数据挖掘的花卉市场研究与应用”项目成果论文(编号:2016530101000037)
摘    要:
大数据时代,数据成为决策最重要的参考之一,通过数据抓取能够准确抓取我们需要的数据,然后挖掘出有用信息。本文以花卉网站为例,提出Web数据抓取与存储框架,实现了抓取Web网站中的半结构化数据,转换成结构化数据存储进数据库,并对数据进行预处理,然后运用数据分析和数据挖掘技术将结果展现出来,帮助花卉企业在花卉市场进行更准确的商业决策。

关 键 词:XML  XPath  R  半结构化  Web数据抓取  数据分析  数据挖掘

Web Semi-structured Data Fetching and Its Statistical Analysis Based on R Language
DENG Yuan-fei;ZHEN Xiao-yun;MENG Jie. Web Semi-structured Data Fetching and Its Statistical Analysis Based on R Language[J]. Value Engineering, 2016, 0(5): 232-234
Authors:DENG Yuan-fei  ZHEN Xiao-yun  MENG Jie
Affiliation:DENG Yuan-fei;ZHEN Xiao-yun;MENG Jie;Kunming University of Science and Technology;Yunnan University;
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号