1 基本情况
题目:基于实时社会网络分析的突发舆情事件动态意见领袖识别方法研究
录用期刊:情报杂志
撰写周期:15 days
审稿周期:2 months
2 写作经过
(1)思路来源。算法竞赛出身还是喜欢做一些数据结构相关的研究。研一写的第一篇文章是基于PageRank政务微博影响力研究,但是路走的太窄,到现在也没找到适合发表的好期刊。于是在导师的建议下选择写一篇意见领袖的文章。
(2)读文献。发现目前基于社会网络理论识别意见领袖的文章还比较少,写的也都比较简单,机会比较大。
(3)想创新点。a.目前用社会网络识别用户影响力的文章,一般基于关注、点赞这种用户交互关系构建网络。这种用户交互关系不仅难爬,爬下来数据还巨冗余。因此想到采用文本距离来衡量用户关联性。文本距离近的言论能表明这些用户想法观念差不多,这样构建起的社会网络就可以挖掘出舆情事件中最受欢迎的观点言论。b.文本距离部分融了三个角度的模型,测的准一点。c.写到一半时想到,针对一个突发事件,事后分析意见领袖其实用处不大,我们必须掌握实时的意见领袖,才能对整体舆情发展态势进行及时的掌控,因此做了一个动态的意见领袖识别过程。d.最后对意见领袖的动态特征进行分析,做一些好看的可视化。
(4)数据。导师选的“新疆棉事件”,python+selenium爬相关微博与评论。数据量:21663个用户,23471条微博言论
(5)代码。(1)爬虫->(2)数据清洗->(3.1)文本距离函数(三方面距离)->(3.2)构建社会网络(定阈值)->(3.3)意见领袖函数(改进PageRank)->(3.4)动态识别主体函数->(4)可视化(python&gephi)
(6)写论文,改论文。
3 论文内容
(1)整体研究框架
(2)章节安排
0-引言
1-相关工作
2-研究方法(2.1研究框架 2.2 文本距离测算 2.3 动态社会网络构建 2.4意见领袖识别)
3-实证分析(3.1案例回顾 3.2 数据采集 3.3 实验准备 3.4 动态社会网络分析 3.5 意见领袖识别 3.6 意见领袖分析)
4-结果讨论与政策建议
5-结论
(3)动态识别意见领袖的过程
(4)一些好看的可视化
(4.a)Gephi做的舆情社会网络变化图(bj不让放彩图我在这里放╭(╯^╰)╮)
(4.b)意见领袖数量比例变化趋势
(4.c)意见领袖排名变化趋势与规律分类
4 时间线
第一篇C走的格外顺利,从开工到录用只花了不到一个学期。可能命运看我这个学期过的太惨了,给了点小小的奖励吧......
8月底 开工
9月10日 完成实验
9月15日 完成初稿
10月5日 根据老师意见改了改,投稿
11月28日 退修
12月14日 完成退修稿,提交之后审了一天就待录用了
qbzz真的超级友好!审稿速度快,审稿超级认真,不论文章好坏返回意见都很多很用心。编辑态度很友好,打电话过去会很温柔很耐心的给我们解答。(不过还是不能乱打电话,后来一篇文章打了某杂志的电话问进度,结果第二天就被退稿了...)
5 一些思考
(1)首先是特别感谢ZP老师的耐心指导,我的文笔实在太烂,多亏了老师一句话一句话的打磨才让这篇文章有中的机会。也特别感恩老师愿意放手让我做自己喜欢的算法,第一篇C能和自己喜欢的一些领域,很幸运。
(2)经过之前将近一年失败的投稿慢慢摸清了情报类C刊的套路。发C的关键在于找到对审稿专家胃口的“创新点”,然后画一些好看的图。而这种找创新点的感觉,需要阅读大量文献去慢慢体会。情报类C刊不需要复杂的模型与高难度的实验,只要和实战结合起来,证明对实际工作有帮助,就很容易得到专家的青睐。