首页 > 增长黑客 > 正文

数据驱动增长?别扯了,先解决数据从哪儿来

5daofeng2018-11-20 15:53:56阅读次数:12267

现在互联网上关于“增长黑客”的概念很火,它那“四两拨千斤”、“小投入大收益”的神奇法力令无数互联网从业者为之着迷。 一般来说,“增长黑客”主要依赖于企业的内部数据(如企业自身拥有的销售数据、用户数据、页面浏览数据等),以此为依据进行数据分析和推广策略拟定。但是,如果遇到如下几种情况,“增长黑客”就捉襟见肘了: 假如一家初创公司,自己刚起步,自身并没有还积累数据,怎么破? 就算有数据,但自己拥有的数据无...

后面关联度较高的词汇依次是“统计分析”、“数据挖掘”、“BI”、“Excel”等,从其中的几个数据工具(Growing IO、神策和友盟等)来看,厂家的品宣软文做的还是蛮好的。


再来看看“数据挖掘”+“运营”下的关联词有哪些,这次采用的method是’most_similar’,结果如下:


数据挖掘”+“运营”


结果显示,这2个词的组合得到的关联词,除了“数据分析”外,还有“精细化”、“BI”、“统计分析”、“(用户)画像”、“数据模型”、“指标体系”、“产品策划”等关键词,它们是数据运营中涉及较多的概念。


下面是“pm”和“运营”的共同关联词,它们能较好的说明运营和产品之间的存在的某些“公共关系”。


“pm”和“运营”的共同关联词


本来,这两个职位由于跟进流程多,涉及面广,需要干各种“杂活”,因而很多产品或运营抱怨自己就是 “打杂”的。


近一段时间,互联网界某些专家适时造出“全栈产品”和“全栈运营”这两个新概念,认为必须在这两个岗位上掌握更多的“斜杠”技能,熟谙相关领域的各个“工种”,最好精通各个流程。


要做好这两个“非技术”的岗位,很多方面不仅要“略懂”,还要扮演“多面手”的角色,比如“技术开发”、“产品策划”等,如此才能在实际工作中“独当一面”。


接下来,笔者从中挑选出出90个跟“数据分析”具有较高关联度的词汇,看哪些词汇在该语境下中提及次数最多,以及这些词之间的共现关系(Co-occurrence Relation),通过词汇链接关系的多寡,找到重要性程度最高的词汇。


90个跟“数据分析”具有较高关联度的词汇


从字体大小来看, “数据”、“数据分析”、“运营”、“数据挖掘”“数据库”、“预测”等词链接的词汇最多,它们的重要性程度在这90个词汇中的重要性程度最高。


从颜色上来看,这90个词根据“关系亲疏(共现关系)”聚集为5个社群(Community),最为突出的是3个社群,分别是:


橙色系的“SPSS”和“SAS”,数据分析工具类;


紫色系的“数据”、“数据分析”、“数据挖掘”等,数据分析相关重要的概念;


绿色系的“营销”、“社会化媒体”、“监测”等,品牌营销类。


其中,“社会化媒体”与“营销”之间的线条最为明显,代表它们之间有很强的关联度—因为社会化媒体正式营销活动的载体,营销活动必须在各类社会化媒体(微信、微博、头条号等)实施。


6.2.4 Lexical dispersion plot(词汇分散图)


接下来,笔者想了解“产品运营&数据分析”栏目中的某些词在2012.05~2017.07之间的数量分布情况,以及它们出现的位置信息(the location of a word in the text),这时可以利用Lexicaldispersion plot(词汇分散图)进行分析,它可以揭示某个词汇在一段文本中的分布情况(Producea plot showing the distribution of the words through the text)。


笔者先将待分析的文本按时间顺序进行排列,分词后再进行Lexicaldispersion plot分析。因此,文本字数的累积增长方向与时间正向推移的方向一致。图中纵轴表示词汇,横轴是文本字数,是累加的;黑色竖线表示该词汇在文本中被提及一次,对应横轴能看到它所处的位置信息,空白则表示无提及。

(编辑:5daofeng)
5daofeng
分享到:0