An Online Data Cleaning Method(一种在线数据清洗方法)

[入库:2005年8月18日] [更新:2007年3月24日]

本文简介:选择自 hjy3789759 的 blog

提出一种新的在线数据清洗方法:将确认为干净的参照表中的记录字符串映射成高维空间中的点后进行聚类划分,然后利用b+树对划分中的点进行索引从而将高维空间的查询转换成一维空间的范围查询。输入表中的元组利用索引采用分枝限界策略搜索knn(k nearest neighbors)记录从而完成与其最匹配记录的识别。理论分析和实验表明这是一种解决在线数据清洗的有效途径。

本文关键:An Online Data Cleaning Method(一种在线数据清洗方法)
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top