欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

“中国式”的数据挖掘 ——试读《数据挖掘技术(第3版)》有感

程序员文章站 2023-12-25 09:43:33
...

“中国式”的数据挖掘

                               ——试读《数据挖掘技术(3)》有感

两年前的五月,我“被老师安排”了毕业论文题。《企业电子商务平台客户细分初探和实现》,还记得那个晚上,我盗取别人的VPN账号,去知网下载论文。那种ctrl+c ctrl+v的快感,会让你迷失,迷失到一篇论文,误以为这么容易就堆砌出来。当然,论文老师很快联系上我,说了一大堆的脏话,引论跟正文没有关系……。那年我也在考研,那种排山倒海的压力,让我无法适从。早上复习,晚上去图书馆翻书,翻书主要的目的是翻看目录,目录可以让你更快了解这类知识的要点(这也是数据挖掘的一个核心思想)。

我记得老师在初评大会上,对我的论文说了一句话:“你认真写好综述先吧,论文可以重写了。”我说:“老师,怎么可以拿到优秀论文?”“你是不可能的,你慢慢写吧”。同组的人员,有一个同学抽到微博类的研究,我心里嘀咕着,我怎么没有抽到更好的呢?

就因为老师这句话,我顶住各种压力。我每天翻阅很多客户细分的书籍,为了拿到优秀论文,我甚至做了一个大胆的决定,直接把我当时打理的商城网站,做了一些功能。这功能就是对客户的行为进行了客户细分。结果当然我拿了那年的优秀论文,我从来没有办不到的事。

好了,先分享一下,我对数据挖掘的一些认识。理所当然,我打开试读pdf的《数据挖掘技术(3)》。老规矩,我先看它的目录。那些词条,让我觉得很亲切,因为以前写论文,对这些词,有过了解。

这本书的知识点很全面,是很多学习数据挖掘的经典。但问题就出在它是本经典,中国式的三个字,又套上头上去了,中国式的数据挖掘,就是一个条条框框,当某一个数据到点后,科研人员把一堆数字比对,计算,最后教条思维是数据挖掘的最大敌人。

很多人在PPT上列出一大堆数据,很多人在生产调整时,常用统计学去预测各种需要的数据。但你有想过这都是西方国家的东西吗?那种水土不服性,会让你厌恶传统的知识,空无乏味。

浏览了一下案例,这些案例都算是经典,感觉中国式的数据挖掘,需要通过理论学习,然后用实际经验,问问自己到底要得到什么数据,要用什么数学工具实现。这才是重点。

上一篇:

下一篇: