心得分享

 

文章(最推薦)

推薦人:蔡宗益963405005

篇名:Fast mining of distance-based outliers in high-dimensional datasets

作者:Amol Ghoting · Srinivasan Parthasarathy · Matthew Eric Otey

文章來源:Data Mining And Knowledge Discovery, Volume: 16 Issue: 3 Pages: 349-364

出刊時間:2008

推薦原因:

在資料探勘領域中,探討搜尋極端值的問題與方法非常多,但多數方式皆只適用於低維度資料或低資料量,若將這些低維度資料處理技術應用於高維度資料中,將導致運算時間倍數成長,系統運算效能過低、資料運算時間過長,及搜尋結果不盡理想等問題。本篇文章主要說明如何在高維度資料中,迅速找出極端值。作者利用類似KNN的處理手法,將高維度資料進行分群作業,利用資料大小作為分群之依據,而後導入低維度資料極端值探測技術,便可快速搜尋極端值,有助於資料分析與辨識。