big data的应用一例之西班牙小孩不上课及午睡与其它
12月3-4日有个Big data world congress,这会议的名头听起来异常气势恢宏又仿佛很野鸡。去听了一天,感觉讲得都很浅,没有多少技术性的东西,基本都是各家粗浅的介绍自己在做什么。倒是提供的伙食异常的好,仿佛就专去蹭了一整天的饭!
对我而言唯一有趣的是spotify的发言——用发言人Wouter de Bie的话,其他人都是西装族,只有他是随随便便的码农形象——所以比较知道我们想听什么,举的例子都非常有意思。
比如他们对他们客户的使用统计
瑞典的各年龄组:
看图很明显,17岁以下的瑞典小孩的曲线非常有特色,在上课时间,他们的使用曲线明显低于其它年龄组,一放学就高扬——所以整体而言,瑞典小孩还是乖乖上课的。
另一个特色是周三和周末夜间曲线有个小小的上扬波动——这是party后回家路上听音乐。周三在瑞典称为小周末,很多人在周三开party。
然后来看西班牙的各年龄组曲线:
西班牙小孩们在上课时间跟别的年龄组没·有·差·别!(主讲当时表示:我不是评判他们什么啦,但是,这个,你们明白的……)
周六的party后小波峰是一致的,但是西班牙并没有周三party的习惯,所以周三就没有类似瑞典的波动。
西班牙与瑞典的另一个极大差别,就是除了小孩子之外,所有西班牙人的曲线都在中午有个明显波谷——这就是西班牙著名的siesta午休时间。(Siesta,西班牙人雷打不动的午睡时间,从3小时到5小时不等)
看,就从听音乐的行为统计,其可以获取的地域差别信息就已如许。
此外spotify举的另一例,风暴Sandy过境时候明显的数据变化(下图对应美国):
完整的飓风路线!
此外还有个很有意思的结论,spotify他们对各种用户界面的各种细小改变都做了详细的用户测试,他们发现各种他们绞尽脑汁想出来的界面美化啦功能增强啦都没有啥很显著的效果——甚至有些反而起反作用,唯一一个真的明显增加点击率的是改变button上的文字!从“download”改成类似play啊try啊listen啊之类会明显增加点击,大约是因为群众本能的对下载存有恐惧心理。
其余都太浅与空泛,包括google等。不值一提。整体只提供了一个各家做big data的现在在做什么的概况印象。
最大的好处的吃得很好,正餐有牛排且沙拉主食甜点齐备,上午下午各有一次茶点时间无数可爱小点心,另有咖啡、茶、水与苹果汁无限量。明年似乎他们还打算弄个Big data Asia congress.
最后附上会议brochure。