« | August 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | | | | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | | | | | | | |
|
|
公告 |
欢迎大家访问,希望大家多多交流!
Email:hello105@ustc.edu
QQ: 7779112
|
统计 |
blog名称:hello105 日志总数:63 评论数量:174 留言数量:3 访问次数:396528 建立时间:2004年11月8日 |
| 
|
W3CHINA Blog首页 管理页面 写新日志 退出
[心情]忙! |
音乐昆虫 发表于 2004/11/24 14:36:22 |
周末女朋友过来玩,呵呵,好好陪她两天,接着就是忙我的事了,因为周四要开会,上周就因为这点事差点被批评,所以这几天都在忙着做文档的聚类。首先查找
资料,找关于tf.idf的资料,用于计算权值。刚开始的时候还以为是一个很深奥的算法,看了才知道只是计算权值得一种很有效的方法,其实大家都能想到
的,tf表示单词在这个文档中出现的次数,df表示这个单词在所有文档中出现的文档数,idf就是用文档数N除以df,然后去对数得到的。这个方法在于对
于大多数文档中都出现的单词,用这种方法求得的权值就很小,也就很好的体现了各个文档的相异之处。聚类算法采用传统的k-mean方法,得到了结果,突然
发现不知道怎么评估,不知道怎么判断聚类的效果了。因为这些文档本身都很专业,如果不接触这些人本身也不好划分,呜呜,郁闷。
最近看着师兄们都在找工作了,也挺关心job方面的信息,毕竟明年这时候就是该我忙了。看着看着觉得很迷茫了,不知道明年这时候我的运气会不会比较好。实
验室的一个本科师弟昨天收到了tencent的offer,给的条件还不错:本科生7万,硕士10万,华为今年好像又在大举招人,不过待遇较之先前以不可
比了,硕士6-7万,博士7万,呵呵,不过在学校里普遍都不认同华为了,因为给人很苦闷的感觉。实验室的另外的师兄铁定是要转行了,投的简历都是关于咨
询、投行的,和技术相关的都没有,其实这也是我一直以来的困惑,做技术出生到底能做到什么位置?有多少前途?迷茫。。。。。,师兄去高盛二面了,祝他好
运,相信他一定能有展现自己才华的空间。
|
阅读全文(1815) | 回复(0) | 编辑 | 精华 |
|