|
回复:数据挖掘模型的评估问题  |
|
|
|
|
|
数据挖掘者 发表于 2007/5/19 22:09:42 |
|
|
|
在07-5-11,Changjiang写道:
Mr Zhang,我是一名大四学生,想请教你一下数据挖掘模型评估方面的问题。配置数据源,进行挖掘设置,选择挖掘算法,运行产生挖掘模型后,给出的结果很难让人信服。如那简单的购物篮分析来讲,产生关联规则和频繁集后,还是需要进一步分析才能弄清楚结果的含义。让某个不太懂数据挖掘的人一时很难获得应有的信息,是结果可视化的问题,还是模型评估的问题?我不太明白,希望给予解答和帮助。还有模型评估的资料从哪找啊?网上挺少的感觉?
以下为IDMer的回复:
Hi, Changjiang,
数据挖掘模型的评估和数据挖掘模型的解释其实是两个不同的层面。对于模型评估来说,我们可能会列举出一系列的评估指标来说明模型的优劣,比如Precision、Recall、LIFT、ROC图等等。但要让用户接受一个模型的结果,仅靠这些评估指标却是不够的,还需要从模型结果的可用性上进一步阐述,即数据挖掘模型到底能带来什么业务上的价值。
就我对你的email的理解,感觉你是希望能找到对于各种挖掘算法的评估指标和方法,然后以此作为衡量模型优劣的标准。资料其实也并不是很难找,但你首先要明白对于不同的算法,评估的方法也可能不同。所以你要针对自己想研究的算法和模型,去搜索该领域内的经典论文(包括算法的发明者所写的,以及业界权威对同类算法的综述和评比等等),在这些论文中常常都会包含常见的评估方法。
从我个人的经验来说,在具体的数据挖掘项目中,算法的选择、模型的调优、获得一个从技术指标上来说还算不错的模型,这些都不是很困难的事情。而将模型的结果向业务人员解释,让他们感觉到模型所挖掘出来的东西是有价值的,这才是数据挖掘人员面临的最大挑战。当然这就需要比较强的行业知识和对业务的敏感。
再回过头来看你提出的问题,对于大四的学生来说,我想你可能会更关注技术上的东西。对于模型解释这个方面,可以暂时不去触及太多,因为那常常需要一些项目实践才能有深入的认识。
Sunstone Zhang
|
|
|
|
阅读全文(8842) | 回复(4) | 编辑 | 精华 |
|
|
|
|
|
|
|
CLEMENTINE的学习 |
|
|
|
|
|
佛爷(游客)发表评论于2007/12/8 23:06:32 |
|
|
|
你好:我是很偶然找到这里,应该说是苦寻已久的地方。我是刚开始学DM,现在象从CLEMENTINE的使用入手,请问有什么好的建议吗?有学习资料吗?
谢谢回复! |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:回复:数据挖掘模型的评估问题 |
|
|
|
|
|
PP(游客)发表评论于2007/10/27 11:02:41 |
|
|
|
我也是一名大四的学生,不过我是学师范类的,我对数据挖掘很感受兴趣,半年前开始关注了,我QQ:149033593 希望能与版主QQ交流,我打算去电视台做基层的数据挖掘者,希望版主老师能提供一些相关的资料,网上资料较多,但大同小易,多写理论,少有详细的数据挖掘分析案例,希老师能提供一点,谢谢 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:回复:数据挖掘模型的评估问题 |
|
|
|
|
|
naln(游客)发表评论于2007/10/7 22:31:33 |
|
|
|
你好,对下面这个术语,可以给个通俗的解释吗?(测量的标准表达方式:Precision/Recall),先谢过了
|
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:回复:数据挖掘模型的评估问题 |
|
|
|
|
|
xiaoxiao(游客)发表评论于2007/8/20 11:20:53 |
|
|
|
请问你所指的Recall,LIFT和ROC图,都是指的些什么样的指标呢 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
| » 1 »
|