首页 > 增长黑客 > 正文

数据驱动增长？别扯了，先解决数据从哪儿来

5daofeng•2018-11-20 15:53:56•阅读次数：12272

现在互联网上关于“增长黑客”的概念很火，它那“四两拨千斤”、“小投入大收益”的神奇法力令无数互联网从业者为之着迷。一般来说，“增长黑客”主要依赖于企业的内部数据（如企业自身拥有的销售数据、用户数据、页面浏览数据等），以此为依据进行数据分析和推广策略拟定。但是，如果遇到如下几种情况，“增长黑客”就捉襟见肘了：假如一家初创公司，自己刚起步，自身并没有还积累数据，怎么破？就算有数据，但自己拥有的数据无...

去除掉上述异常点之后的聚类图谱：

聚类图谱

从上图中可以看出，虽然因为维度过高，不同类别簇群存在重合现象，但不同的颜色明显的将文章类别进行了区分，按照“阅读量”、“收藏量”、“评论量”、“标题字数”这4个维度进行的DBSCAN聚类可以分为5个类别。

（3）阅读量与正文字数、标题字数之间的关联分析

接着，笔者分别对“阅读量”与“标题字数”、“正文字数”做了散点图分析，以期判断它们之间是否存在相关关系。

阅读量与正文字数、标题字数之间的关联分析

从上图来看，阅读量和标题字数之间并没有明显的线性相关性，标题字数及其对应数量的散点分布，近似形成了一条左偏态的正态曲线，从图像上印证了上面的描述性分析，而且更新了我们的认知：在10~30这个“标题字数”区间的文章数量最多，而标题字数过多未必是好事。

阅读量和正文字数在大体上呈负相关关系

从上图可以看出，从1000字开始，阅读量和正文字数在大体上呈负相关关系，即文章字数越多，阅读量越小。由此看来，大家都比较喜欢短平快的“快餐式”阅读，篇幅太长的文章看起来太磨人。

6.1.3 热门文章特征分析

一篇文章的“收藏量”能在一定程度上反映读者对该文章的价值度的认可，较高的收藏量能代表该文章的质量属于上乘。而从一定数量的高收藏量文章中，我们又能间接的从中发掘出读者的阅读偏好，进而界定读者群体的某些特征。

在这部分，笔者筛选出收藏量大于1,000的文章，各栏目合计下来，不多不少，刚好60篇。以下是它们在各栏目下的数量分布情况：

从上表中，笔者发现如下信息：

“产品经理”栏目下收藏量过1,000的文章数量最多，占到半数；

“分析评测”下的文章数量不多，但读者互动最多（平均评论量为90）；

“分析评测”、“交互体验”、“业界动态”、“原型设计”入围的文章数量不多，但它们的平均阅读量较高

以上3点仅是从数值型数据上获得的认知，但是这些热门文章到底有哪些特征，我们不得而知，由此，笔者统计了这些热门文章的标题中的高频词，并将其制成关键词云：

高频词

从上面的高频词，“Axure”、“干货”、“工具”、“新人”、“7天”、“速成”等高频词可以间接的推测出，这些文章的主要面向初学者（按照心理学上的“投射原理”，读者其实也大都是初学者），以干货类、工具类和方法论为主题，并透露出浓厚的“成功学气息”（如“速成”、“7天”、“必学”等词），具有这类标题特征的文章，堪称“眼球收割机”，初学者合并小白喜闻乐见，最是喜欢。

<<<1 2 3 4 5 6 7 8 9 10 11 >>>

(编辑：5daofeng)