5daofeng•2018-11-20 15:53:56•阅读次数:15799
后面关联度较高的词汇依次是“统计分析”、“数据挖掘”、“BI”、“Excel”等,从其中的几个数据工具(Growing IO、神策和友盟等)来看,厂家的品宣软文做的还是蛮好的。
再来看看“数据挖掘”+“运营”下的关联词有哪些,这次采用的method是’most_similar’,结果如下:
数据挖掘”+“运营”
结果显示,这2个词的组合得到的关联词,除了“数据分析”外,还有“精细化”、“BI”、“统计分析”、“(用户)画像”、“数据模型”、“指标体系”、“产品策划”等关键词,它们是数据运营中涉及较多的概念。
下面是“pm”和“运营”的共同关联词,它们能较好的说明运营和产品之间的存在的某些“公共关系”。
“pm”和“运营”的共同关联词
本来,这两个职位由于跟进流程多,涉及面广,需要干各种“杂活”,因而很多产品或运营抱怨自己就是 “打杂”的。
近一段时间,互联网界某些专家适时造出“全栈产品”和“全栈运营”这两个新概念,认为必须在这两个岗位上掌握更多的“斜杠”技能,熟谙相关领域的各个“工种”,最好精通各个流程。
要做好这两个“非技术”的岗位,很多方面不仅要“略懂”,还要扮演“多面手”的角色,比如“技术开发”、“产品策划”等,如此才能在实际工作中“独当一面”。
接下来,笔者从中挑选出出90个跟“数据分析”具有较高关联度的词汇,看哪些词汇在该语境下中提及次数最多,以及这些词之间的共现关系(Co-occurrence Relation),通过词汇链接关系的多寡,找到重要性程度最高的词汇。
90个跟“数据分析”具有较高关联度的词汇
从字体大小来看, “数据”、“数据分析”、“运营”、“数据挖掘”“数据库”、“预测”等词链接的词汇最多,它们的重要性程度在这90个词汇中的重要性程度最高。
从颜色上来看,这90个词根据“关系亲疏(共现关系)”聚集为5个社群(Community),最为突出的是3个社群,分别是:
橙色系的“SPSS”和“SAS”,数据分析工具类;
紫色系的“数据”、“数据分析”、“数据挖掘”等,数据分析相关重要的概念;
绿色系的“营销”、“社会化媒体”、“监测”等,品牌营销类。
其中,“社会化媒体”与“营销”之间的线条最为明显,代表它们之间有很强的关联度—因为社会化媒体正式营销活动的载体,营销活动必须在各类社会化媒体(微信、微博、头条号等)实施。
6.2.4 Lexical dispersion plot(词汇分散图)
接下来,笔者想了解“产品运营&数据分析”栏目中的某些词在2012.05~2017.07之间的数量分布情况,以及它们出现的位置信息(the location of a word in the text),这时可以利用Lexicaldispersion plot(词汇分散图)进行分析,它可以揭示某个词汇在一段文本中的分布情况(Producea plot showing the distribution of the words through the text)。
笔者先将待分析的文本按时间顺序进行排列,分词后再进行Lexicaldispersion plot分析。因此,文本字数的累积增长方向与时间正向推移的方向一致。图中纵轴表示词汇,横轴是文本字数,是累加的;黑色竖线表示该词汇在文本中被提及一次,对应横轴能看到它所处的位置信息,空白则表示无提及。