首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
罗琪 《价值工程》2012,31(30):207-208
本文研究了基于模糊聚类的Web文本挖掘和模糊聚类有效性评价函数,并将其应用于Web文本挖掘中模糊聚类有效性评价。仿真实验表明该方法有一定的准确性和可行性。  相似文献   

2.
数据挖掘的一个重要研究方向是聚类分析。聚类是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程。通过聚类使得同一组内的数据对象具有较高的相似度,而不同组中的数据对象相似度较低。本文简单介绍了几种常见的聚类分析算法及这些算法普遍存在的一些问题。  相似文献   

3.
《价值工程》2020,(2):250-252
针对目前视频推荐系统功能少、推荐数据不全面,以及采集用户数据不全推荐能力弱,用户体验差等问题,提出了一种基于聚类算法的视频推荐系统算法。通过自主开发的聚类算法中的AP-聚类分层分析所获取到的不同的用户信息,以及不同的用户的视频的关注度信息,形成不同的用户视频信息聚类库,结合用户视频信息库中的历史数据,进行标签设置,自主进行计算权重,利用开发的聚类层进行用户对视频信息的喜好进行排序,生成喜好序列表,最后通过聚类分层模型计算出不同用户在聚类信息库中的喜好视频信息,进行标签和推荐。该算法成功的对不同用户的视频信息进行了标签和推荐,且推荐针对性较强,命中率较高,具有一定的学术研究价值和实际推广意义。  相似文献   

4.
文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型.此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤.研究中,在用户识别步骤加入了时闻维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度.经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展.实践证明,该模型是可行的,并具有良好的可扩展性.  相似文献   

5.
文章对Web日志数据的预处理进行研究,建立了一个通用的基于Web日志数据预处理的模型。此模型主要包含数据清理、用户识别、会话识别、路径补充、格式化5个基本步骤。研究中,在用户识别步骤加入了时间维度,基于此实现的算法在一定程度上提高了Web日志中用户识别的准确度。经过预处理之后,Web日志数据由原来的半结构化被转换成结构化,并存储在数据库中,以便后期Web挖掘的开展。实践证明,该模型是可行的,并具有良好的可扩展性。  相似文献   

6.
《企业技术开发》2016,(2):55-57
针对模糊C-均值聚类算法不能很好对非椭球形分布,或结构形状不对称分布的数据进行聚类的问题,文章提出了一种基于点密度的模糊C-均值聚类算法PD-FCM,该算法利用数据的点密度能够反映其对不同数据密度分类的符合程度的这一特性,构造了修正参数来改进基于欧几里德距离度量方式,从实现对FCM算法的优化。在人造数据集和知名数据集上的实验结果该算法在准确率和隶属度的准确性方面优于模糊C-均值聚类算法。  相似文献   

7.
《企业技术开发》2015,(29):46-47
谱聚类算法作为一种高效的智能聚类算法被广泛地研究与应用,它与传统的聚类算法相比,具有明显的优势。文章首先对谱聚类理论进行了概述,介绍了图划分准则、谱松弛及谱聚类算法,后介绍算法在SAR图像分割中的应用,并对分割时出现的一些问题加以分析和讨论,对研究谱聚类算法及其对SAR图像的分割具有一定得理论参考。  相似文献   

8.
张娟  李莉 《物流科技》2022,(1):35-37
在物流配送中心中,对于货物进行拣选一直以来都是物流配送作业中的核心环节,对货物拣选的作业量高达60%,且货物拣选作业成本占总作业成本的50%~75%,因此拣选作业是制约配送效率提高的关键环节。文章以单区型的物流配送中心订单拣选作业为研究对象,着重研究货物的拣选路径。通过采用基于订单相似系数的聚类算法对订单进行分批拣选和基于禁忌搜索算法对订单拣选路径进行计算,并将它们的结果与订单不分批结果进行比较,从而得到禁忌搜索算法的优化高于聚类算法,拣选路径的优化提高了64%,同时这两种方法跟不分批订单拣选路径相对比,都能够有效提高拣选货物的效率,分别提高了69%和89%,减少人力劳动,在一定程度上减少了物流作业成本。  相似文献   

9.
协同过滤算法是目前个性化推荐系统中应用最成功的推荐算法之一。目前协同过滤构建的用户-项目矩阵,一般是按用户对所有项目的评分构建,却没有考虑项目之间的分类情况,导致寻找的邻居集合可能不是最近邻居集合。针对此问题,本文提出基于项目聚类和评分预测的协同过滤推荐算法,该算法首先按商品聚类,将大矩阵按聚类的商品来进行子矩阵的计算,在子矩阵里进行兴趣度的测量,最后将在所有区域相似用户的推荐项目合并,成为该用户的最后推荐结果。实验证明新算法能够提高协同过滤推荐系统的推荐质量。  相似文献   

10.
本文将模糊C-均值聚类算法应用到了的刀具磨损预测方法中,以振动信号作为特征信号,通过具体检测实验在不同转速下跟踪采集刀具磨损各阶段的振动信号,然后求出信号的时域特征值作为预测样本值,通过模糊C-均值聚类算法对待测样本进行划分类,利用欧几里得贴近度法最终实现刀具磨损预测。结果表明,预测结果与刀具实际磨损状态相符,模糊C-均值聚类算法通过振动信号有效地分类刀具磨损模式。  相似文献   

11.
文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文首先对基于空间向量模型的文本聚类过程做了较深入的讨论和总结。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20Newsgroup文本语料库,针对向量空间表示模型,在开源的数据挖掘平台WEKA上实现了文本预处理和k-means聚类算法,并根据实际聚类效果,就文本表示、特征选择、特征降维等方面提出优化方案。  相似文献   

12.
数据挖掘中聚类分析综述   总被引:1,自引:0,他引:1  
张静 《价值工程》2014,(15):226-227
数据挖掘中的聚类技术是一种非监督分类技术。概述了聚类分析算法中的数据结构和数据类型,分析了聚类分析的意义及研究现状,比较了几种聚类算法的优点及问题,并结合通信领域的应用指出了K-Means聚类技术的绝对优势。  相似文献   

13.
范洪军 《价值工程》2014,(31):241-243
本文在传统网络教学和资源共享课程系统平台的基础上,运用数据挖掘技术对资源共享课程数据挖掘技术进行智能化的优化。在资源共享课程建设数据库中建立基于数据分析的数据仓库,采用关联计算,聚类分析,TF-IDF等方法,找到系统中资源之间的内在联系,使系统资源智能地跟踪用户操作,为资源共享课程的网络平台教学活动提供更人性化的服务。  相似文献   

14.
Information explosion is a critical challenge to the development of modern information systems. In particular, when the application of an information system is over the Internet, the amount of information over the web has been increasing exponentially and rapidly. Search engines, such as Google and Baidu, are essential tools for people to find the information from the Internet. Valuable information, however, is still likely submerged in the ocean of search results from those tools. By clustering the results into different groups based on subjects automatically, a search engine with the clustering feature allows users to select most relevant results quickly. In this paper, we propose an online semantics-based method to cluster Chinese web search results. First, we employ the generalised suffix tree to extract the longest common substrings (LCSs) from search snippets. Second, we use the HowNet to calculate the similarities of the words derived from the LCSs, and extract the most representative features by constructing the vocabulary chain. Third, we construct a vector of text features and calculate snippets’ semantic similarities. Finally, we improve the Chameleon algorithm to cluster snippets. Extensive experimental results have shown that the proposed algorithm has outperformed over the suffix tree clustering method and other traditional clustering methods.  相似文献   

15.
王怀宇  卢秉亮  张莉  朱健 《价值工程》2012,31(13):139-140
在分析了常用的几种QoS保障的算法基础上,给出了负载均衡模型,提出应用数据挖掘中的聚类算法求解MPLS网络负载均衡问题。该算法融入权重信息有效地提高了搜索效率。仿真结果证明算法是有效的,显著改善了传统MPLS网络负载均衡路由算法易于导致的网络流量分布不均衡的状况。  相似文献   

16.
易星 《价值工程》2011,30(11):182-183
本文主要介绍Web数据挖掘技术的相关知识及应用,并重点对Web数据挖掘技术与网络教育中主要对象即学生、教师、学校三者之间的相关挖掘应用进行了一些分析和探讨,对提升高校的网络教育管理与决策水平,营造一个现代化的、数字化学习环境,充分发挥Web数据挖掘在网络教育中的作用。  相似文献   

17.
邓南沙  苏文 《科技与企业》2012,(18):272-274
本文主要研究数据挖掘技术在股票市场价格预测中的应用,重点采用数据挖掘分类和聚类算法对大盘走势和个股走势进行分析研究,采用实体数据进行挖掘分析,总结得出有益于投资者的结论。  相似文献   

18.
俸世洲 《价值工程》2011,30(18):154-155
本文把Web报名系统与数据挖掘相结合,建立独立学院招生决策模型。首先,建立一个适用于数据挖掘的招生Web报名系统,用它来采集更直接、更客观的考生数据;其次,用关联规则对考生数据进行挖掘,发现数据中的潜在的规则,作为我们进行招生宣传的决策依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号