博客广告投放位置的社会网络分析与选择(2)
2016-08-08 01:00
导读:社会网络分析(SNA),是指通过对社会网络模型中各社会成员(结点)之间关系和相互交往模式的分析,发现对应的社会网络结构。目前,社会网络分析已广
社会网络分析(SNA),是指通过对社会网络模型中各社会成员(结点)之间关系和相互交往模式的分析,发现对应的社会网络结构。目前,社会网络分析已广泛用于组织行为分析、组织关系分析、人工智能、数据通信与信息安全等方面。当然,社会网络分析也不是万能的,也存在一些缺陷,如只能对静态数据进行分析,对动态数据分析的能力很弱,无法观察因时间因素和结点互动而造成的圈体演化过程,一些重要的影响因子有时也会被遗漏。
在社会网络模型图中,结点的个数总和称为结点大小(Size),结点与结点之间的连结程度成为密度(Density),每个结点所具有的连线称为度(Degree),结点与结点之间的路径长度称为距离(Distance),网络中所有结点之间的最大路径称为网络直径(Diameter)。社会网络分析的目的,最基本的是要找出网络中的一些关键结点,如Hub结点、Betweenness结点、Closeness结点等,如图1所示。在图1中,Andre与Carol结点之间有交互,但与Ike结点之间没有交互,因此Andre与Carol结点之间用一根直线相连,而与Ike结点之间没有用直线相连。社会网络中,存在三种不同类型的关键结点,即三种类型的中心点,分别为Degree Centrality、Betweenness Centrality、Closeness Centrality。Degree Centrality又称Hub结点,是指具有最大度的结点,如Diane结点,它一般是社交圈中的领导或专家,很多成员需要与他进行联系。Betweenness Centrality又称桥接点,是图中关键路径上的点,一般可连接两个不同的社区,如Heather结点,离开它Ike、Jane结点就不能与圈中的其他成员进行交互,它一般是经纪人。Closeness Centrality是指结点与其他结点的距离总和最短,它虽不处于网络的中心位置,但具有网络中的最佳视野,能够观察到网络中的所有流通的信息。
图1 一个社会网络模型
显而易见,对于博客网,若在这三种类型的关键点上投放广告,要比在其他结点上投放广告,所聚合的受众人数要高得多,同时效率也高得多;再结合分析关键点上的博文内容,也就能掌握社交圈的主题,对提高定向广告的精准性有很大好处。
3.博客广告投放位置的选择
博客网具有社会网络的特征,网上存在不同类型的社交圈,通过数据挖掘和社会网络分析,找出博客网不同社交圈中的三种类型的关键点,作为博客广告的最佳投放位。
三、查找关键结点的一般方法
在博客网上查找关键结点的一般方法,分为四个过程,分别为:搜集博文、对博文内容进行提取、网络分析、可视化输出,如图2。
图2 关键结点查找的过程
1.搜集博文
搜集博文的一般方法是利用网络爬行程序,从相关的博客网上搜集并下载所要的博文。
2.信息提取
在获得博文之后,需要对信息进行提取。由于不同的博主可能使用不同的博文摸板,因此信息提取的过程也比较复杂,需要使用一些诸如模式匹配和实体抽取的技术,实际操作时,可根据具体情况进行简化处理。
3.网络分析
网络分析是发布博文定向广告最重要的环节。网络分析主要集中在三个方面:拓扑分析、关键结点分析和群体分析。
拓扑分析的目的主要是验证博客网,在拓扑分析的过程中,使用了几种统计分析指标,如平均最短路径长度、聚合系数、度的分布。平均最短路径长度反映了网络中各个结点之间的总体最短路径,可用来衡量结点间通信的效率;聚合系数表明了网中结点聚合成群体的可能性大小;度的分布概率P(k)能表明一个结点有k个连接的概率大小。