首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于语义的相似性重复记录检测
引用本文:唐玲玲,刘思帆.基于语义的相似性重复记录检测[J].中国电子商务,2010(2):57-58.
作者姓名:唐玲玲  刘思帆
作者单位:中国矿业大学计算机科学与技术学院,221116
摘    要:本文针对数据清洗中存在的记录之间语义相似性问题,提出了一种基于语义的相似性重复记录检测方法。该方法在检测重复记录时,不仅考虑记录之间的句法相似性,还考虑了他们之间的语义相似性。

关 键 词:数据清洗  相似性  重复记录  检测
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号