«August 2025»
12
3456789
10111213141516
17181920212223
24252627282930
31


公告
欢迎大家访问,希望大家多多交流!
    Email:hello105@ustc.edu
    QQ: 7779112
    

我的分类(专题)

首页(63)
Xml收藏(3)
Java收藏(17)
心情(11)
其他(32)


最新日志
DataStage 开发中遇到的几个问题
Tar的详细用法(转自Linux伊甸园)
UNIX常用命令-目录及文件操作命令(z
The 38 Subsystems of
DataStage安装
回来了!
rpm使用
学校好冷清阿
科大怪谈(1)
科大怪谈(2)

最新回复
回复:DataStage 开发中遇到的几
回复:DataStage 开发中遇到的几
回复:发放WALLOP邀请
回复:发放WALLOP邀请
回复:发放WALLOP邀请
回复:发放WALLOP邀请
回复:发放WALLOP邀请
回复:发放WALLOP邀请
回复:发放WALLOP邀请
回复:发放WALLOP邀请

留言板
签写新留言

为什么?
回学校了
关于wallop

统计
blog名称:hello105
日志总数:63
评论数量:174
留言数量:3
访问次数:396528
建立时间:2004年11月8日

链接

Lost Ferry

 




W3CHINA Blog首页    管理页面    写新日志    退出

[心情]忙!
音乐昆虫 发表于 2004/11/24 14:36:22

     周末女朋友过来玩,呵呵,好好陪她两天,接着就是忙我的事了,因为周四要开会,上周就因为这点事差点被批评,所以这几天都在忙着做文档的聚类。首先查找 资料,找关于tf.idf的资料,用于计算权值。刚开始的时候还以为是一个很深奥的算法,看了才知道只是计算权值得一种很有效的方法,其实大家都能想到 的,tf表示单词在这个文档中出现的次数,df表示这个单词在所有文档中出现的文档数,idf就是用文档数N除以df,然后去对数得到的。这个方法在于对 于大多数文档中都出现的单词,用这种方法求得的权值就很小,也就很好的体现了各个文档的相异之处。聚类算法采用传统的k-mean方法,得到了结果,突然 发现不知道怎么评估,不知道怎么判断聚类的效果了。因为这些文档本身都很专业,如果不接触这些人本身也不好划分,呜呜,郁闷。         最近看着师兄们都在找工作了,也挺关心job方面的信息,毕竟明年这时候就是该我忙了。看着看着觉得很迷茫了,不知道明年这时候我的运气会不会比较好。实 验室的一个本科师弟昨天收到了tencent的offer,给的条件还不错:本科生7万,硕士10万,华为今年好像又在大举招人,不过待遇较之先前以不可 比了,硕士6-7万,博士7万,呵呵,不过在学校里普遍都不认同华为了,因为给人很苦闷的感觉。实验室的另外的师兄铁定是要转行了,投的简历都是关于咨 询、投行的,和技术相关的都没有,其实这也是我一直以来的困惑,做技术出生到底能做到什么位置?有多少前途?迷茫。。。。。,师兄去高盛二面了,祝他好 运,相信他一定能有展现自己才华的空间。

阅读全文(1815) | 回复(0) | 编辑 | 精华


发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)
站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.180 second(s), page refreshed 144760363 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号