首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2491274
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
回复:数据挖掘模型的评估问题 
数据挖掘者 发表于 2007/5/19 22:09:42
在07-5-11,Changjiang写道:   Mr Zhang,我是一名大四学生,想请教你一下数据挖掘模型评估方面的问题。配置数据源,进行挖掘设置,选择挖掘算法,运行产生挖掘模型后,给出的结果很难让人信服。如那简单的购物篮分析来讲,产生关联规则和频繁集后,还是需要进一步分析才能弄清楚结果的含义。让某个不太懂数据挖掘的人一时很难获得应有的信息,是结果可视化的问题,还是模型评估的问题?我不太明白,希望给予解答和帮助。还有模型评估的资料从哪找啊?网上挺少的感觉?   以下为IDMer的回复: Hi, Changjiang,    数据挖掘模型的评估和数据挖掘模型的解释其实是两个不同的层面。对于模型评估来说,我们可能会列举出一系列的评估指标来说明模型的优劣,比如Precision、Recall、LIFT、ROC图等等。但要让用户接受一个模型的结果,仅靠这些评估指标却是不够的,还需要从模型结果的可用性上进一步阐述,即数据挖掘模型到底能带来什么业务上的价值。     就我对你的email的理解,感觉你是希望能找到对于各种挖掘算法的评估指标和方法,然后以此作为衡量模型优劣的标准。资料其实也并不是很难找,但你首先要明白对于不同的算法,评估的方法也可能不同。所以你要针对自己想研究的算法和模型,去搜索该领域内的经典论文(包括算法的发明者所写的,以及业界权威对同类算法的综述和评比等等),在这些论文中常常都会包含常见的评估方法。     从我个人的经验来说,在具体的数据挖掘项目中,算法的选择、模型的调优、获得一个从技术指标上来说还算不错的模型,这些都不是很困难的事情。而将模型的结果向业务人员解释,让他们感觉到模型所挖掘出来的东西是有价值的,这才是数据挖掘人员面临的最大挑战。当然这就需要比较强的行业知识和对业务的敏感。     再回过头来看你提出的问题,对于大四的学生来说,我想你可能会更关注技术上的东西。对于模型解释这个方面,可以暂时不去触及太多,因为那常常需要一些项目实践才能有深入的认识。   Sunstone Zhang    

阅读全文(8842) | 回复(4) | 编辑 | 精华
CLEMENTINE的学习
佛爷(游客)发表评论于2007/12/8 23:06:32
你好:我是很偶然找到这里,应该说是苦寻已久的地方。我是刚开始学DM,现在象从CLEMENTINE的使用入手,请问有什么好的建议吗?有学习资料吗? 谢谢回复!

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:回复:数据挖掘模型的评估问题
PP(游客)发表评论于2007/10/27 11:02:41
我也是一名大四的学生,不过我是学师范类的,我对数据挖掘很感受兴趣,半年前开始关注了,我QQ:149033593  希望能与版主QQ交流,我打算去电视台做基层的数据挖掘者,希望版主老师能提供一些相关的资料,网上资料较多,但大同小易,多写理论,少有详细的数据挖掘分析案例,希老师能提供一点,谢谢
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:回复:数据挖掘模型的评估问题
naln(游客)发表评论于2007/10/7 22:31:33
你好,对下面这个术语,可以给个通俗的解释吗?(测量的标准表达方式:Precision/Recall),先谢过了  
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:回复:数据挖掘模型的评估问题
xiaoxiao(游客)发表评论于2007/8/20 11:20:53
请问你所指的Recall,LIFT和ROC图,都是指的些什么样的指标呢
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
» 1 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.047 second(s), page refreshed 144761771 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号