张华平:微博的大数据分析
张华平首先做了一段基本经历的描述,然后讲述了随着社交网络的飞速发展,社交网络大数据对人们生活的理解以及大数据的实际作用。张华平通过“知著”、“见微”、“晓意”三个层面举出了人们对于“大数据”的片面的理解,并表达了自己对于“大数据”的观点。
2013年4月26日-27日,由51CTO传媒集团旗下WOT(World Of Tech)品牌主办的2013大数据全球技术峰会在北京富力万丽酒店召开。本次峰会将围绕大数据基础架构与上层应用的生态系统,解决大规模数据引发的问题,探索大数据基础的解决方案,激发数据挖掘带来的竞争力,让数据发出声音。51CTO作为本次峰会的主办方,将全程视频、图文直播报道这场数据的盛宴,更多内容请点击专题:2013大数据全球技术峰会。
在4月27日的互联网与大数据专场论坛中,北理工网络搜索挖掘与安全实验室主任张华平先生表了主题为“微博特征与行为的大数据挖掘分析”的演讲。
张华平首先做了一段基本经历的描述,然后讲述了随着社交网络的飞速发展,社交网络大数据对人们生活的理解以及大数据的实际作用。张华平通过“见微”、“知著”、“晓意”三个层面举出了人们对于“大数据”的片面的理解,并表达了自己对于“大数据”的观点。
他指出社交网络对人们的生活的影响,其中包括授课、购物等等各个方面。
然后张华平又谈到了他之前做过的对于新浪微博做过的具体的数据的调查。当谈到了微博数据的获取,张华平称4亿微博用户只有5%的用户资料为有价值资料,并且分析了这些用户中不同类型的用户的不同的价值。然后分析了不同地区的微博用户数量,其中各地区微博用户数量与当地GDP的增长有正比关系。并逐步分析了微博的发布规律、粉丝规律、关注数规律等等。
通过一种影响力计算算法,并罗列了性别、是否加V认证等具体数据,对不同类型用户的影响力进行了分析。
然后又对许多具体的方面进行了详尽的分析,其中包括自我介绍文本挖掘,微博个性行为与建模 ,微博个性分析的交叉原理,微博博主的个性化分析,以及他对自己的微博个性化分析,原创与转发的不同 ,张华平通过各种各样的具体用户数据分析,点透了大数据时代的点点滴滴,话题与情感,微博话题跟踪,明码暗语”识别,微博博主情绪感知。
张华平演讲期间诙谐幽默,内容通俗易懂,很大程度上调动了现场观众的情绪,获得了观众很高的反响。
以上是51CTO.com记者从一线为您带来的精彩报道。后续我们还有更加精彩的独家报道,敬请关注。