基于数据挖掘的社交网络分析与研究论文 篇一
社交网络分析 (SNA) 是一种应用数据挖掘技术来研究和分析社交网络结构的方法。它可以帮助我们理解社交网络中的关系和交互,并提供有关个体和整体行为的洞察。本文将介绍SNA的基本概念和方法,并探讨如何利用数据挖掘技术来分析和研究社交网络。
首先,我们需要了解SNA的基本概念。社交网络是由一组个体和它们之间的关系组成的。在社交网络中,个体可以是人、组织或其他实体,关系可以是朋友关系、合作关系、信息传播关系等。SNA通过研究网络中个体之间的关系来揭示网络的结构和特征。其中一种常用的网络结构指标是度中心性,它衡量了一个个体在网络中与其他个体之间的连接数量。除了度中心性,还有许多其他的网络结构指标,如接近中心性、中介中心性等,可以帮助我们更全面地理解网络的结构与特征。
其次,我们可以利用数据挖掘技术来分析和研究社交网络。数据挖掘是一种从大量数据中自动发现模式和知识的过程。在社交网络分析中,数据挖掘可以帮助我们挖掘网络中隐藏的关系和模式。例如,我们可以通过分析社交网络中的节点之间的关系来识别社区结构,即具有紧密连接的节点群体。这样的社区结构可以帮助我们理解网络中不同群体之间的联系和交互。
此外,数据挖掘还可以帮助我们预测和模拟社交网络的行为和演化。通过分析网络中的历史数据,我们可以建立模型来预测未来的网络行为。例如,我们可以利用数据挖掘技术来预测一个人在社交网络中的好友数量,或者预测一个产品在社交网络中的传播效果。这样的预测可以帮助我们在实际应用中做出更明智的决策。
总之,基于数据挖掘的社交网络分析与研究是一个非常有意义和有挑战性的领域。通过应用数据挖掘技术,我们可以揭示社交网络的结构和特征,并预测和模拟网络的行为和演化。这些研究成果可以对社交网络中的个体和整体行为有深刻的洞察,并在实际应用中产生重要的影响。
基于数据挖掘的社交网络分析与研究论文 篇二
社交网络分析 (SNA) 是一种基于数据挖掘技术来研究和分析社交网络结构的方法。在这篇论文中,我们将介绍一种基于SNA的社交网络分析模型,并探讨如何应用该模型来分析和研究社交网络。
首先,我们需要建立一个适用于社交网络分析的模型。在这个模型中,我们将社交网络表示为一个图,其中节点表示个体,边表示个体之间的关系。然后,我们可以利用数据挖掘技术来分析这个图的结构和特征。例如,我们可以计算每个节点的度中心性和接近中心性,以了解个体在网络中的重要性和影响力。我们还可以计算网络的聚集系数和平均最短路径长度,以评估网络的紧密性和连通性。
接下来,我们可以利用这个模型来研究社交网络中的具体问题。例如,我们可以研究社交网络中的信息传播过程。通过分析网络中的节点之间的传播路径和时间,我们可以了解信息在网络中的传播速度和范围。我们还可以研究社交网络中的社区结构。通过识别具有紧密连接的节点群体,我们可以了解网络中不同群体之间的联系和交互。
在研究社交网络时,我们还可以结合其他的数据源。例如,我们可以将社交网络数据与地理位置数据结合起来,以研究不同地区之间的社交网络差异。我们还可以将社交网络数据与时间序列数据结合起来,以研究网络的演化和变化。这样的结合可以帮助我们更全面地理解社交网络的结构和行为。
总之,基于数据挖掘的社交网络分析与研究是一个非常有意义和有挑战性的领域。通过建立适用于社交网络的分析模型,并结合其他的数据源,我们可以深入研究社交网络的结构和行为。这些研究成果对于理解和应用社交网络具有重要的意义。
基于数据挖掘的社交网络分析与研究论文 篇三
基于数据挖掘的社交网络分析与研究论文
摘要:在计算机网络越来越普及的社会中造就信息传播的便利性提高,也让社交网络渐渐发展成为虚拟社群形态,从早期的电子布告栏(BBS)到现在的社交网站(SocialNetworkSites),都可以让人们密切讨论与互动。本文将主要探讨基于数据挖掘模型的社交网络关联预测分析,并对相关技术进行阐述。
关键词:数据挖掘;社交网络;关联预测
在社交网络上,依据先前国外学者Viswanath,Mislove,ChaandGummadi和NguyenandTran都是针对theNewOrleans地区社群使用者发布数据来研究使用者发布的关系,而台湾地区针对使用者社群发布的分析多以问卷方法居多,故本研究欲使用直接抓取页面数据与卷标的方法,观察使用者社群网站上发布行为,利用先前用学者所提数据呈现方式,结合关键词标记方式来了解使用者在社群网络上的发布关系。而其中社群人数拓展最快速就是微信平台,利用了社交网络的特性让使用者能更有效率的在网络上找到有关系的亲朋好友,将这世界的每个人、每个群体透过各种关系快速的串连起来[1]。
1数据挖掘模型的概述
当要对HDFS读写数据时,档案将被切割成小的64MBBlock,NameNode将告知每个DataNode,切割后的block是存放在哪,DataNode将负责做本地端档案的block数据对应,并且同时DataNode将对其他DataNode进行数据复制备份的动作。Hadoop系统的容错率和可扩充性来自于DataNode,当DataNode出错意外关机,其它节点上的数据将依然存在,且当需动态增删系统的运算量,只需增加DataNode节点或停止DataNode运作。在进行社群资料收集与前处理之前,要先了解一下信息撷取与信息过滤的不同之处。在社群网站上随机寻找开放目录上的使用者,而后进行下载该使用者发布数据的动作是谓信息撷取;而将使用者涂鸦墙上大笔数据写进本地端的HDFS系统后,并通过预先设定的一些筛选条件式和过滤方法,剔除杂乱的数据,变成对本研究有用的信息,以利后续卷标计算与关键词计算,这个过程就叫信息过滤[2]。
2基于数据挖掘模型的社交网络关联预测分析
关键词分析部份则是针对个人涂鸦墙页面和使用者自订信息页面进行关键词标记,其关键词来源是使用者自订信息页面上含的运动、音乐、书籍、电影、电视、游戏、宗教、政治八组关键词。相关度计算是利用本研究所提相关度公式来进行个人涂鸦墙页面、使用者自订信息页面和模拟页面间的关联运算,利用页面间所含的关键词,计算出仿真页面与使用页面间的相关度。并在相关度计算阶段把社群发布分析与关键词分析的结果做个交叉分析。之后对此分析结果进行研究评估。使用者自订信息页面有让使用者自己标记自己兴趣的分类项目,分为大四大类自订选项,其自订选项下,包含子项目让使用者自订标记自己的兴趣,而该表的使用者自订分类项目就是本研究挑选关键词的依据,本研究挑选运动、音乐、书籍、电影、电视、游戏、宗教、政治这八个字作为关键词标记投掷的项目,在此就不考虑同义不同字、字面背后意涵等问题,只考虑第一层的字义[3]。
3社交网络关联预测的.相关技术与应用
社交网络分析一直以来都是个热门的话题,所有团体成员彼此之间社交关系的集合就是这个团体的社交网络,而透过社交网络分析可以了解团体成员之间的互动,这分析可应用在各种与人有关的领域上。在学校里,学生之间小团体的组成及班级中领导人物与被孤立者的存在,一直都是教育者相当关心的部份。在团体精神治疗中,成员之间的交流情况是分析治疗成果的指标之一。在网络社群中,了解使用者群体之间的互动可以帮助厂商开发更人性化的网络产品。人格特质分析也是个热门的话题,每个人的行为都有一套固定的行为模式,而分析这行为模式就是所谓的人格特质分析,这分析也可应用在各种与人有关的领域上。在学校里,不同类型的
学生需要不同方式的教育。在公司面试上,公司透过分析应征者的人格模式来录取所需要的人才[4]。然而,一般心理学使用的社交网络分析与人格特质分析都是透过纸笔测验,使用大量的人力去取得人际互动的信息,考虑团体成员间友好的互动关系,并使用方向性的连结来表达人们之间的互动关系。目前使用计算机视觉技术的社交网络分析系统,仅考虑人们同时出现频率当作亲密程度的指针,而且使用无方向性的连结来表示人们之间的互动关系。因此,我们使用拥有计算机视觉技术的多摄影机系统,透过分析人们之间的互动行为,互动行为包含互动的对象、所表达的肢体语言与情绪信息,根据分析所有的互动得到团体内所有成员之间的社交态度,而这就是这团体的社交网络。除了友好的互动关系之外,我们还考虑了厌恶的互动关系,并且使用方向性的连结来表达人们之间的互动,这让我们的社交网络分析能更贴切现实的互动情况。通过分析一个人所有的社交互动行为,可以得知此人的行为拥有何种倾向,而这行为模式就是这个人的人格特质。总之,我们可以根据观察分析人们的互动行为,得到与人们观察得到的结果大同小异的社交网络分析,证明我们能透过计算机视觉技术取得贴近现实的社交网络分析,并且比起一般心理学的社交网络分析省下许多不必要的人力。
参考文献:
[1]王云驰,邓倩妮.关联信息在社交网络中传播的竞争模型[J].微型电脑应用,2015,(3):22-24.
[2]魏爽,高华玲.利用数据挖掘方法进行社交网络关联预测[J].电脑知识与技术,2015,(12):46-48.
[3]李阳,王晓岩,王昆,沙瀛.基于社交网络的安全关系研究[J].计算机研究与发展,2012,(S2):124-130.
[4]向程冠,熊世桓,王东.基于关联规则的社交网络好友推荐算法[J].中国科技论文,2014,(1):87-91.