心得分享
文章(最推薦)
推薦人:蔡宗益963405005
篇名:Fast mining of distance-based outliers in high-dimensional datasets
作者:Amol Ghoting · Srinivasan Parthasarathy · Matthew Eric Otey
文章來源:Data Mining And Knowledge Discovery, Volume: 16 Issue: 3 Pages: 349-364
出刊時間:2008
推薦原因:
在資料探勘領域中,探討搜尋極端值的問題與方法非常多,但多數方式皆只適用於低維度資料或低資料量,若將這些低維度資料處理技術應用於高維度資料中,將導致運算時間倍數成長,系統運算效能過低、資料運算時間過長,及搜尋結果不盡理想等問題。本篇文章主要說明如何在高維度資料中,迅速找出極端值。作者利用類似KNN的處理手法,將高維度資料進行分群作業,利用資料大小作為分群之依據,而後導入低維度資料極端值探測技術,便可快速搜尋極端值,有助於資料分析與辨識。