首页 > 增长黑客 > 正文

数据驱动增长?别扯了,先解决数据从哪儿来

5daofeng2018-11-20 15:53:56阅读次数:12272

现在互联网上关于“增长黑客”的概念很火,它那“四两拨千斤”、“小投入大收益”的神奇法力令无数互联网从业者为之着迷。 一般来说,“增长黑客”主要依赖于企业的内部数据(如企业自身拥有的销售数据、用户数据、页面浏览数据等),以此为依据进行数据分析和推广策略拟定。但是,如果遇到如下几种情况,“增长黑客”就捉襟见肘了: 假如一家初创公司,自己刚起步,自身并没有还积累数据,怎么破? 就算有数据,但自己拥有的数据无...


去除掉上述异常点之后的聚类图谱:


聚类图谱


从上图中可以看出,虽然因为维度过高,不同类别簇群存在重合现象,但不同的颜色明显的将文章类别进行了区分,按照“阅读量”、“收藏量”、“评论量”、“标题字数”这4个维度进行的DBSCAN聚类可以分为5个类别。


(3)阅读量与正文字数、标题字数之间的关联分析


接着,笔者分别对“阅读量”与“标题字数”、“正文字数”做了散点图分析,以期判断它们之间是否存在相关关系。


阅读量与正文字数、标题字数之间的关联分析


从上图来看,阅读量和标题字数之间并没有明显的线性相关性,标题字数及其对应数量的散点分布,近似形成了一条左偏态的正态曲线,从图像上印证了上面的描述性分析,而且更新了我们的认知:在10~30这个“标题字数”区间的文章数量最多,而标题字数过多未必是好事。


阅读量和正文字数在大体上呈负相关关系


从上图可以看出,从1000字开始,阅读量和正文字数在大体上呈负相关关系,即文章字数越多,阅读量越小。由此看来,大家都比较喜欢短平快的“快餐式”阅读,篇幅太长的文章看起来太磨人。


6.1.3 热门文章特征分析


一篇文章的“收藏量”能在一定程度上反映读者对该文章的价值度的认可,较高的收藏量能代表该文章的质量属于上乘。而从一定数量的高收藏量文章中,我们又能间接的从中发掘出读者的阅读偏好,进而界定读者群体的某些特征。


在这部分,笔者筛选出收藏量大于1,000的文章,各栏目合计下来,不多不少,刚好60篇。以下是它们在各栏目下的数量分布情况:


从上表中,笔者发现如下信息:


“产品经理”栏目下收藏量过1,000的文章数量最多,占到半数;


“分析评测”下的文章数量不多,但读者互动最多(平均评论量为90);


“分析评测”、“交互体验”、“业界动态”、“原型设计”入围的文章数量不多,但它们的平均阅读量较高


以上3点仅是从数值型数据上获得的认知,但是这些热门文章到底有哪些特征,我们不得而知,由此,笔者统计了这些热门文章的标题中的高频词,并将其制成关键词云:


高频词


从上面的高频词,“Axure”、“干货”、“工具”、“新人”、“7天”、“速成”等高频词可以间接的推测出,这些文章的主要面向初学者(按照心理学上的“投射原理”,读者其实也大都是初学者),以干货类、工具类和方法论为主题,并透露出浓厚的“成功学气息”(如“速成”、“7天”、“必学”等词),具有这类标题特征的文章,堪称“眼球收割机”,初学者合并小白喜闻乐见,最是喜欢。

(编辑:5daofeng)
5daofeng
分享到:0