大数据是不是泡沫?
长文干货预警,多图预警,手机党退散,马桶党退散。
我的结论可能会招来部分业内人士的不满,所以事先声明,以下所有仅代表我个人观点。
这段时间非常密集的纵览了所有大数据的公司,自己分析了各个环节的商业模式,也学习了部分技术,还有通览了市场需求情况,时间关系,演变的可能性。
因为我有自己的分析模型,并且这套模型回测过去的无数科技行业和互联网行业都是很准的,这次用了这个模型来套用了一下大数据。
最终得出一个结论:
大数据不仅是泡沫,而且是相当大的泡沫。
当然还有一个次结论
大数据的确是未来,但回报率相当堪忧
里面很多环节,都隐藏着极大的危险,无数决定聪明的玩家,都会被这股浪潮吞没。
当然,如何成为最后的赢家这个方法还是有迹可循的。
我一步一步展开
首先我们来看大数据概念的全景图:
美国:
国内来源新一点,是2016年新出炉的:
这里面的公司,我基本上一个一个看过去,有些网站已经欠费关停了,有些一看就知道前景堪忧,有些产品结构非常透明,门槛超低,一两个人就能做出来。
先说为什么是泡沫,这里面说的是大部分业态,当然肯定有业态是健康的:
大部分大数据的环节,是轻量化、工具化的,这些大多数都得死,因为上不着天(直接客户关系),下不着地(用户结构和粘性)。
比如说可视化工具,就是我上面说的,产品结构非常透明,一两个人的小团队就能做出来。
又比如说采集工具,同样是这个问题。
所以我们可以直接下结论:所有的数据的轻量化工具全都得死。看到这句话的,又恰好在专注于轻量化工具的团队,建议你们好好考虑一下可行性。
先说一个问题:这个比较核心
1.数据到底值不值钱?
我现在可以明确的说,占全部数据量90%以上的的原始的易采集的数据非常不值钱。
为什么呢?
爬虫这个东西,我一开始不是太懂,但是花了几个小时,基本上通了,无论是用python自己写一个小型的,还是直接用现成的各种软件,都是很快就可以部署并开始采集。
中国有一两百万的程序员,还有外围的稍微懂点编程的小站长,另外爬虫软件的出现可以让一个大学生随便花点时间就可以学会采集。
所以,易采集,门槛低是第一点
第二点是什么呢
就是数据的可复制性导致其廉价,尤其是非结构性的数据
这个不用解释了吧,比如你辛辛苦苦写了个网站源码,或者辛辛苦苦手动录了一本书,你放淘宝上买个一两百,刚卖出一两个,你就会发现隔壁出现了10块钱的,5块钱的,1块钱的。
所以,数据源这块面临很大的问题。
哦对了,我们换个角度,其实一目了然了,当然这种方式不严谨,权当娱乐了。
所以个人认为,数据源这块,最后会剩下一些免费为主的API接口,和几个半死不活的所谓数据交易市场,仅此而已。
而对于下游的用户,他们更情愿按照自己的需求自己去采集,除非工程浩大的数据,才会经济上权衡后决定是否会买。
所以我前面专栏里有篇文章,说我只做这个环节,我现在正式承认,我当时的考虑的确错了。
2.下面来看第二个环节,就是分析和可视化。
之前可视化这块已经被否掉了,现存的可视化产品已经有了数百种了,而且他们都是免费的。
来看看分析,分析这块也有两种,一个是开发一套工具或者软件,让客户购买,并且可以为他们做好构架。
另一个是建一个分析平台,让企业自己进去自定义。
这一块,我比较看好国内的一家,之前也在知乎看到过,这里就不给他们打广告了。
首先工具软件这一种,我可以肯定:中国肯定行不通,美国或许行得通。
第二个就是在线分析平台了。
其实这个是很靠谱的方向,为什么呢?
就现在来看,在线分析平台其实本质并非大数据,而是一个在线协作系统,在他之前,早就有诸如印象笔记,明道这种夸端的在线协作平台获得了市场的认可。
这里放个Dashboard界面,我是很看好这家公司的,甚至一度考虑要不要也往这个方向去做……
应该说,现在除了最前卫的互联网和电商企业,大量的实体,中小企业和事业单位都需要这样的数据分析工具。
但是这个工具还不够。
我这里提出一个概念,就是全端多级用户的数据分析平台,包括采集端和分析端,这个绝对是未来的方向。
为什么呢?
从现在来看,大量的数据采集是线上的工作。
而其实,在冰山下面,也就是我们的潜在客户中,他们的数据采集恰恰是线下的。
比如医院的病例,比如考勤表,比如客户回访记录。
也就是说,平台要做好,一定要做全端,要有采集端。
同时呢,因为全端平台这种产品其实是挺透明的,客户直接用两家的demo和价格表对比一下,高下立见。
数据分析在这个环节,我们可以得出一个结论了:
单纯做可视化等等轻量工具肯定没有出路。
做全端的全方位数据分析平台能解决未来的大需求,但竞争仍然很激烈,最后能剩两家盈利都算乐观的。
其实,还是那个老话,有时候老老实实开发起来,几个互联网巨头分分钟抄了你的,你一点办法都没得。
我们完全可以判断,3年后,出现网易云分析,百度云分析,阿里云分析,腾讯云分析。(当然这些基本都有雏形或者成熟的嫁接体了)
3.插一个算法环节的思考
算法,包括机器学习和人工智能这块,其实是很有诱惑力的,因为这块是技术的最前沿,如果说大数据是基础设施建设的话,那么算法和人工智能就是正在建设中的摩天大楼。
但是,算法同样有两个问题:
发明算法(从0到1发明而非优化)的人没有得到多少好处,算法极易抄袭复制。
高级算法即使不断地产生,现有的计算力也无法跟上。
第二个如果实在不好理解的话,你可以去玩《钢铁雄心3》,玩苏联,然后部队全部交给AI托管,你会发现,苏德大战一旦打起来,你的电脑就卡成翔。
所以我对这个环节的看法是:超前且吃力不讨好。
4.最后谈谈BI这块
这块可能是大数据概念里最接地气的一环了。
其实BI早就开始了,可以说早在1999年salesforce成立时,大数据应用这一块就正式开跑了。
而BI这一块的特点就是:垂直、细分
比如我做医疗的,那我就只能专做医疗的,我要去做重工的,产品不兼容。
即使我努力开发了跨行业的产品线,势必会被各自行业更专注的玩家打败。
为什么呢?因为行业信息不互通,一个行业只认一个行业的。
另外谈一点,BI的前景,我感觉要比分析这个环节大很多很多。
为什么呢?因为人或者客户,喜欢解决方案,不喜欢客观事实。
他要你直接帮他解决问题,帮他提高销量提高效率,而不是冷静的告诉他这里如何如何,那里如何如何。
宅男们需要你告诉他怎么样才能追到女生,而不是冷静地告诉他女性的性格分布,心理特征。
另外,BI这块也将是一片混战,群雄逐鹿,以前的咨询公司,ERP公司,互联网巨头,财务公司什么的都得杀进来。
5.插两个题外话,有两个方向,可能是稳赚不赔的
一是做大数据方向的自媒体,坐拥流量收益,赚点广告费。
二是针对二三线城市客户的服务模式,有点像前些年的建站服务和SEO服务公司,利用信息不对称赚钱。
再补充一些结论:
1.如果你是个5人以下的团队,并且立志于做一个很好的小产品的话,建议你们不要继续了,因为最乐观的前景就是谁谁买了你们公司,但是可能性极低,或许会有资金支持你们,但我相信资金很难陪你们走到最后。
2.最后的生存者只有三种类型:A全环打通的巨无霸(很可能仍是BAT)、B客户关系牢固的政企服务者、C先发优势带来用户基数的先行者,以市场地位逼退其他觊觎者。
希望会出现第四种:D产品驱动,并且性价比一流的良心公司。
点名必死的模式:
1.非结构性数据交易平台
2.轻量化工具
看好的模式:
1.全端(采集端、分析端)的数据分析平台
2.细分且能实际解决问题给客户带来效益的BI
3.无论任何形式,吃政府红利的
---------------分析完毕,广告部分--------------
有人会说,你这么公开你的思考,不怕竞争对手比你快吗?
答:不怕,
原因一,大数据到底怎么发展,谁都说不准,我判断对的成功率很低,这点我还是有自知之明的。
原因二,这些分析背后的数据和理论支撑,我从来也永远不会公开。
原因三,直接竞争里,好名字占的权重很大,我们已经占了个好名字(无量数据),所以不畏惧。
这里还是得说一下,我们团队还仍然在观望并分析大数据到底切入哪一块,后面还有大量的市场调查和演算模型在完善,而且现在仍然召集创始合伙人中,技术优先,SJTU优先(各路英雄也欢迎详谈,不问出处,态度决定一切)。
所以有兴趣参与进来的朋友,欢迎加我的微信:rjfrant。
当然,大家的时间都很宝贵,希望你能直抒来意,免去客套,坦诚相待。
另外还是要声明一下,这些碎片化的分析,请仅作为参考,不要当做指南,因为说不定坑了你呢,哈哈。
最后一句忠告:不要为了做大数据而做大数据。