从技术竞争到获取数据的竞争
2020-07-02 本文已影响0人
景芝白亁
今天每个搜索引擎都有用户点击数据和搜索结果的相关数据模型,也就是所谓的“点击模型”,该模型的准确性取决于数据量的大小,一个搜索引擎积累的数据越多,搜索就越精准,bing 做不过google的原因不是因为算法不行,而是缺乏数据,同理,中国的小搜索引擎公司相对于百度的最大劣势也是在数据上;因此整个搜索行业其实是在数据层面的竞争。
从这个角度思考,一些奇怪的问题就有答案了:
1. 搜狗为什么做不赚钱的输入法
2. 为什么国内各大互联网公司都设法推出自己的浏览器(没有太多真正的技术含量)
3.为什么360免费杀毒第一个给你推荐的安装软件就是360浏览器
因为微软通过IE收集用户使用Google的点击情况,用来完善并改进自己的搜索模型。这在国内市场上也是如此,搜索质量的竞争转变成了浏览器以及其它客户端软件市场占有率的竞争,从外面看是技术的竞争,更准确的将是获取数据的竞争。
顶级的互联网公司的成功不仅靠的是技术和数据,还是采用了大数据的方法论,或者说是大数据思维;而作为数据公司,做事情的方法跟传统的公司是不一样的,因为很多时候工程师很少花大量的时间来确定因果关系,而是从大数据中去挖掘相关性,据说google 有四成的工程师是从事数据挖掘的。