2012 Weekly report 2 博客分类: 周记 pageranktwitterrank
程序员文章站
2024-03-03 00:01:04
...
最大的收获是将要做研究的点确定,然后将一篇很不错的论文挑选了出来,同时好好的读了一遍,虽然读了有好些日子,但是鉴于英语的能力确实不怎么样,所以也没有什么办法了,只能一句一句的去读懂,然后慢慢理解,最终的读完了,幸好,挑的论文不错,符合我的研究点的同时,还能给我一些小的启发。
微博影响力的分析方法确实不少,仅仅是从微博的一些小应用就可以看到了,不过那些都是一些比较基础的方法了。也有国外的比较深入一点的。最基本的方法就是直接看粉丝数,谁的粉丝多,说明他的影响力大,这个方法存在了太大的缺陷,一堆僵尸粉就能提高很大的影响力。接下来又有在粉丝数的基础上结合评论,转发和收藏这些信息进行分析,这样子看起来好像是不错了,但是同样存在着一些不足的地方,不过好像我没有了解到,我之前的想法就是按这个方式,可以是可以,就是不知道效果如何。接下来就是大名鼎鼎的Google的打分方法,PageRank算法了,这个方式将用户放在一个很广的网络里面考虑,将一个指向某人的链接当做一个投票,投票越多,那么说明这个人的影响或者权重越大,同时,考虑了打分的用户的影响力,他的影响力越大,那么他给打分的人的影响力也就越大,即加了一个权重系数。之后又有Sensitive-Topic 方法,直接利用用户的微博信息来判断,从微博信息中提取主题,判断每一个主题的影响力,之后综合起来决定影响力。最后看了一个是TwitterRank的方法,其实也是从PageRank出发,结合了主题分析,主题越相近,那么就说明影响力越大,同时加了链接结构的特点,即结合了pagerank和sensitive的方法,挺不错的一个想法。之后还看到了一些K-shell分解法,社会网络熵方法,看起来方法还是挺多的。不过还是觉得TwitterRank更好~~决定按这个方法去重做实验。再看论文的同时,想着做一下兴趣挖掘,应该不错~
除了看论文,也花了一点时间去图书馆看了一下《网络,群体和市场》这一本书,确实有些收获的,了解了好些模型,好些原理,知道了好些概念吧,总之还是社会网络研究的基础书籍。
下一周,奔向下一个目标,PageRank!!come on!!