基于语义的相似性重复记录检测 |
| |
引用本文: | 唐玲玲,刘思帆.基于语义的相似性重复记录检测[J].中国电子商务,2010(2):57-58. |
| |
作者姓名: | 唐玲玲 刘思帆 |
| |
作者单位: | 中国矿业大学计算机科学与技术学院,221116 |
| |
摘 要: | 本文针对数据清洗中存在的记录之间语义相似性问题,提出了一种基于语义的相似性重复记录检测方法。该方法在检测重复记录时,不仅考虑记录之间的句法相似性,还考虑了他们之间的语义相似性。
|
关 键 词: | 数据清洗 相似性 重复记录 检测 |
本文献已被 维普 万方数据 等数据库收录! |
|