一种基于云计算的海量web数据挖掘算法 |
| |
作者姓名: | 张艳格 高丽燕 |
| |
作者单位: | 郑州经贸职业学院经济系,河南郑州450000 |
| |
摘 要: | 基于单一节点的数据挖掘系统在进行海量Web数据挖掘时存在存储与计算的瓶颈,利用云计算的分布式处理优势,提出一种能够在云计算环境下进行分布式处理的基于MapReduce的PageRank算法,将云计算融入Web数据挖掘来解决Internet上广域分布的海量数据挖掘问题。
|
关 键 词: | 云计算 Web数据挖掘 MapReduee编程模式 PageRank算法 |
本文献已被 维普 等数据库收录! |
|