内容摘要:4.5博文内容分析提取样本中的博文内容生成词频统计分析样本,采用武汉大学ROST WordParser中文分词系统进行切词及词频分析。5用户关系特征分析由于“博文转发数”、“博文评论数”、“关注数”、“粉丝数”、“博文数”等数据项不满足正态分布,本文应用Spearman相关系数对上述数据项进行相关性分析及回归分析。5.2相关分析相关分析是一种基于假设检验的统计分析方法,相关系数表明两变量之间的相关程度。设置粉丝数与博文数为偏相关分析变量,关注数为偏相关分析控制变量,进行双侧检验,偏相关分析结果如表5所示。
关键词:分析;博客;博文数;粉丝;样本;浪微;评论;网站;发布;图
作者简介:
微博客用户行为特征与关系特征实证分析
——以“新浪微博”为例
作 者:王晓光
作者简介:王晓光,男,1980年生,华东师范大学信息学系硕士研究生(上海 200241),连云港师范高等专科学校计算机系讲师,发表论文3篇(连云港 222006)。
原文出处:《图书情报工作》(京)2010年第14期 第66-70页
内容提要:微博客是继博客之后迅速发展起来的一种新的社交网络平台。以“新浪微博”为研究样本,较为系统地研究微博客的基本结构、信息传播一般模式,考察微博客用户基本行为特征和关系特征,分析微博客影响力的相关变量,并建立影响力回归方程。
关 键 词:微博客/影响力/信息传播 Micro-blog/Influence/Information transmission
1 引言
微博客是博客的一种变体,在维基百科中被描述为“一种允许用户及时更新简短文本并公开发布的博客形式,允许任何人阅读或者只能由用户选择的群组阅读。用户可通过即时通讯工具、网页等终端发布、更新博文”。博客虽已成为一种有效的信息沟通与交流方式,但依然具有进入门槛,而微博客则将门槛降到最低[1]。
本文首先分析微博客的运行机制,再以“新浪微博”作为研究对象,提取数据样本,应用社会科学统计软件、表格处理软件和文本自动分类方法,挖掘“新浪微博”中用户行为特征;最后应用社会科学统计软件对表征用户关系的参数进行相关与回归分析,揭露“新浪微博”中用户关系的一般规律。
2 微博客网站的运行机制
2.1 跟随机制
用户之间的沟通交流基于一种“关注与被关注”的跟随机制,即用户可随时“关注”他人,成为他人的“粉丝”,其他用户也可“关注”自己,成为自己的“粉丝”,此过程为双向可逆过程。跟随机制使得用户以最简单的方式订阅信息、广播信息,形成一个个大小不一的传播节点。如图1所示。
图1 跟随机制示意
2.2 信息传播机制
用户信息在发布的同时会被传送到跟随用户的接收终端(PC、PDA、手机等),跟随者接收后可及时做出评论,也可选择将消息继续转发出去,让更多的用户得以分享。在信息传播过程中,信源与信宿之间是一种“后背对前脸”的信息流动,可以一点对一点,也可以一点对多点,信息像广播一样同时传递给所有跟随者。
3 数据获取与预处理
本文研究样本来自“新浪微博”的“随便看看”板块。“新浪微博”是由新浪公司开发的一款国内主流的微博产品,作为样本具有一定代表性。从2009年11月30日至2009年12月30日,在每天的19点至21点时段,随机选取该板块100条微博内容。对每条微博内容的处理过程为:提取发布者、发博途径、博文内容、博文转发数、博文评论数五项数据,再通过“发布者”链接至其个人主页,提取个人的关注数、粉丝数、博文数三项数据,上述八项数据组成一条记录。最终得到3 000条记录作为样本,将样本记录保存为Excel文件。







