各种研究报告和统计的出现迷惑了判断的方向,如何科学地防止欺诈?
短视频越来越受欢迎,越来越多的内容从业者进入这个行业,越来越多的机构正在发表研究报告和数据,越来越多的学院正在“武装”数据。
短视频创业者也乐于从中发现信息,发展技能,发掘机会。作为一个投身于抖音短视频行业的90还往前的数据工作者,想分享一些我的经验,这也许不够帮助你赚到第一桶金,但至少可以教你防骗帮你省钱。
一、虚心地了解,谨慎地怀疑
所有数据都不能轻信。以“报告”为例,所有报告都有传播使命,特别是免费的报告,以及那些“意外流出”的报告。
包括抖音官方的报告、微信官方的报告、快手官方的报告,其本质都是公关宣传,是官方把想告诉大家的信息广而告之。
看的时候要批判性地看,多想一想背景,想一想报告发布者实际想说什么,结合更多的数据以及你自己的经验来验证。
所以一定要多听,多看,多对比,多分析,虚心地了解一切,谨慎地怀疑一切。当心被廉价的数据报告误导。尽信数不如无数,也是说的这个道理。
如何第一时间分辨不可信的报告?分享一个简单的方法:
如果没有一页甚至几页研究说明(包括样本情况,比如性别年龄婚姻状况受教育程度等的分布,还有样本数量,怎样清洗数据,剔除了哪些数,二手资料是如何收集的),都是娱乐性报告。
如果是官方发布,那就是官宣性报告;如果是第三方的,那就是胡编性报告。
以当下流传比较多的抖音数据为例,说说几类常见的数据陷阱。
- 第一类陷阱:偷工减料的粉丝画像;
- 第二类陷阱:未经去重的粉丝加和;
- 第三类陷阱:故弄玄虚的创业导师;
二、偷工减料的用户画像:第一类陷阱的发现与解决
很多机构出的抖音达人粉丝画像都有问题。这里有两个原因:
1. 数据分析偷了懒,用方便抽样所得数据推断总体。
所谓方便抽样,通俗讲,就是怎么方便怎么来。
比如说标题为“我爬了xxx条数据,发现xxx”这样的报告,作者一般是爬到什么分析什么,但没爬到的部分可能更重要,通过方便抽样获得的数据无法推断总体,难免以偏概全。
2. 原始数据质量低,不经谨慎清洗无法得出正确结论。
抖音APP里多数用户的资料不真实或不准确,爬这些数据不太可能分析出正确结果。计算机科学里有个说法叫“垃圾进,垃圾出”(garbage in, garbage out 简称GIGO),用在数据分析上也很合适。
比如很多达人的粉丝报告,显示抖音用户中最高比例的星座是摩羯座。这样的画像,建议不看。为什么呢?
多数人填生日都选1月1号(默认值),正好是摩羯座,这样你就明白为什么抖音用户那么多摩羯座了。这是个很严重的错误,但确实有很多做数据的人不动脑子,不负责任。
那什么样的粉丝画像数据是可信的?
1. 通过抖音企业号管理平台(蓝V及开通购物车的账号可用)可以看自己的数据,这里类似微信公众号后台,可以看到比较详细的数据;通过星图平台可以看任意入驻达人的粉丝画像,官方拥有完整数据,计算出的结果更准确。
2. 非官方数据经过严格的清洗过程后,统计结果也有一定价值,但很多数据研究者为了节省成本省略掉了这一环节。
提个建议给第三方研究者,爬虫获得的数据质量很差,不建议拿来分析。如果一定要分析的话,需要进行严格的清洗,以下是一个可以操作的清洗方法:
首先,剔除生日为1月1日的数据。
其次,要过滤掉达人粉丝中的大量灰产账号(举例,我曾分析过认真少女_颜九的粉丝,发现有数百个连续账号,发布的作品内容完全一样,并且都引流到一个社交账号卖东西)。
此外,要根据权威机构发布的网民性别年龄分布来纠偏(比如CNNIC发布的手机网民分布)。
最后,公布样本量和数据集,提高可信度。
这样的粉丝画像做出来,才是一个负责任的研究,才是可以给人看的,当然这么做也需要极高的投入。
三、未经去重的粉丝加和:第二类陷阱的辨别与防范
这类错误常见于培训班、MCN机构、行业社群的夸张宣传。
短视频行业里有一些培训机构/社群自称是抖音头部机构/社群,成员总粉丝量有20亿、30亿,我听过最夸张的说法是80亿。这是个非常胡闹的统计指标。
如果你接触过电视广告的效果评估,应该会知道,有一个概念叫GRP,中文叫毛评点,把收视率乘上到达率再加总用来评估广告效果。
计算过程中不去重,经常能算出非常大的数字,被很多人拿来忽悠广告主。
这个指标产生于技术落后的时代(当时不容易监测数据,不容易去重),在一定的历史时期确实发挥了重要作用,但也因为它不去重的致命缺点而广受诟病。
经历了互联网时代,UV的概念(去重的独立浏览量)已经深入人心,技术上可以有效地进行去重,得到真实访客数或者说受众数量。如果这个时候有人谈到粉丝量时还是简单相加不去重,就很值得怀疑。
所以当有人抛过来一个数据说,抖音号矩阵累计粉丝量多少时,一定要问他,去重后是多少,这是数据人的基本素质。
如果对方答不出,有两种可能:一种是他也不清楚自家的粉丝情况(这样的话,是他能力不行),一种是他有意隐瞒(这样的话,是他良心不好)。
四、故弄玄虚的创业导师:第三类陷阱的识破与远离
真正的大号,都有一个共同特点,就是内容足够打动人,从而“打动算法”(因为算法也是为了筛选好的内容,实现优胜劣汰)。
参考资料:今日头条算法原理()
然而很多投机者通过不正当的方式在短时间内获得了大量流量,然后又将自己的“成功经验”拿来出售大搞“知识付费”。但事实上,他们所传授的诸如“养号”、“搬运”、“刷粉”、“买赞”、“擦边球”、“去水印”、“开权限”、“买账号”、“模拟器”、“ARM机”等灰色操作,并不能让账号持续健康地成长,反而会让账号遭到封禁,也干扰了平台的正常秩序,导致“劣币驱逐良币”的后果,也让很多人挖空心思钻空子,无心创作。
这类“导师”大多都巧妙利用了大多数人意识里的一个误区:快速增长。快速增长是好事吗?未必,要看长多少。快速涨到一两万粉丝能说明什么呢?
什么也说明不了。2018年年初的时候,因为作者相对少,观众相对多,稍微有点质量的视频都可以引来几万粉丝,即使是弄虚作假买粉丝,价钱也便宜得很。
如今,作者相对多了,而抖音的用户增长(观众增长)相对平稳,狼多肉少,越来越多的视频曝光机会少了,涨粉自然变难了,由于平台的技术升级,买粉也变得越来越贵。
这些“导师”在容易涨粉的时代低成本积累了一些粉丝,到不易涨粉的时代卖课圈人。作为商人我当然佩服,作为传授技能的老师,我觉得他们不配。
一个小建议:拜师报班时,仔细观察一下老师的粉丝是否还在增长,调查一下老师的学员们是否做出来真正的大号,再看看他们的视频有多少人在评论,评论里说了什么,以此来判断,他是不是在骗你。
我还看过一个古典互联网的流量大佬写出的“战报”,说新号视频发布几分钟后粉丝达到几千,十分钟后上万,半小时后两万,第二天一睁眼就十万了。
我去看了一下他视频下的评论,发现每条评论的内容都是“转发”两个字,于是我推测,这个人是通过在群里发红包等方式进行了付费转发,通过转发者带来的长尾效应积累起了一定量的粉丝。我觉得大佬可能并不懂抖音。果然,过了一周以后再去看那个号,粉丝还是十万。
有朋友劝我说,大家各走各的路,你不要妨碍别人发财。我觉得不是这个道理,正是因为这些人破坏了规则,才让一些本来不错的视频没能被推荐。我们或举报或曝光,无非是抢回本该属于我们的流(nv)量(ren)。
导师们还有个毛病,就是喜欢编造谣言,听起来好像有道理,但仔细想想又没有根据。比方说一机多号或一号多机会被限流,比方说一机双卡会被限流,比方说多个号用同一个WIFI会被限流,比方说删视频会被限流,比方说不能用微信传文件要用钉钉传,比方说不能认证蓝V,比方说不能投dou+,比方说不要@抖音小助手……
有些是胡说八道,有些则是只说表象不说本质。事实上限流的原因很简单,你的内容不过关,根本不值得推荐。
做抖音被骗,亲人两行泪。
有些人做抖音急于求成上来就找培训班,我觉得这种方法并不可取。其实官方有很多资源是需要反复学习和实践的,比如《入坑必读》。
还有一点需要提醒,即使是合规的、善意的、白帽的经验分享,也不总是行之有效。因为抖音是算法主导,千人千面,每个人的差异性很大。
2018年,我见过大量把自己的小经验小心得拿出来分享卖课的,最终被学员证明没什么用,也见过一些大忽悠,我想你也知道。
别人的方法,可以听,可以借鉴,但除了坚持做优质的内容这一条准则肯定没错之外,每个达人都需要探索一条符合自己的、与众不同的路。
这条路注定孤独。
作者:Wentao,90前数据工作者
本文由@Wentao 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议