数创客 | 文科生炼成数据分析师的秘诀是?
上个月,由新浪微舆情数据PM高长宽老师,做客大数据live,为我们带来了一堂名为“文科生转型数据分析之旅”的分享课。课堂一方面以高老师本人的转型之旅为借鉴,一方面对所有想要学习数据分析的“门外汉”给出了合理建议。课后, 大家对这些建议都比较认可,也对高老师其人产生了好奇——他本人是个怎样的人?今天,数创客就为大家揭秘!
高长宽
• 新浪微舆情数据PM
• 擅长文本挖掘
• 笔名: 苏格兰折耳喵
• 人人都是产品经理 &PMCAFF 专栏作家
01.
带「猫男」属性的产品经理
他的公号是从2016年6月24日开的,到现在文章只有46篇,算下来年产23篇,对于一个做内容推送的人来说不算高,但基本上每篇都很长,时常能够看到万字长文,留言区里面不乏“干货”,“花两天才看完”的留言,而他在产品经理上的总阅读量已经达到了74.7W,点赞2970,一个数据男给自己的笔名叫“苏格兰折耳喵”,问他原因,他说原来住的楼下有只猫特别有灵性,会专门选一个人流量特别大的十字路口,只要看到女生经过就去上前去蹭,女生就会喂鸡腿之类的给它,但这猫看到男生就会不理不睬,他觉得这只猫特别懂营销懂运营,会找准目标人群下功夫。
「苏格兰折耳喵」在人人都是产品经理的主页
02.
不是书呆子的书虫
有个问题问高老师说如果你要生成自己的词云,你觉得里面会有哪些词,高老师认真的想了很久说到:好奇心、研究狂、不设限。这几点能从他看书中体会到,自诩为无所不知营销人的我,有时候也会不知道他说的话题而心虚。涉猎十分广泛,但对数据专业的认识十分透彻。即使说到自己从小看到大的历史书也不忘提到数据分析,特别提了黄仁宇的《明代的漕运》,说这本书用到了大量的数据分析。
除了历史书还特别提到了查理芒格的 “多元思维模型”,查理芒格看了历史、数学、物理、统计、经济学、工程学、生物学等十几门学科,所以他看待一个事情会特别客观,基本上把一个事情的很多变量都掌握了,可能其他领域查理芒格懂得不是很深,但正因为通晓了各个领域的知识会帮助他做出一个正确的决策,建立出准确的量化投资模型。
“一般人来讲说一个人看书看多了会看成书呆子,那是因为看的书太窄,太狭隘了,缺乏跟外界的事物进行交流”,他觉得看书不能专看一家之言,除了要阅读技能相关的书以外,也需要广泛阅读人文社科图书。最重要的是要学会辩证思维和整体思维,数据分析里的工具其实很简单,最重要的是思维方式。
03.
「自我锻造」能力极强的职场新人
跟他的对谈中能体会到这是个十分热爱自我学习的人,从他的职业经历中能够略窥一二。研究生时期在服装公司实习,然后加入一家名叫「奇怪果园」的O2O校园生鲜公司,再后来和好朋友一起创业,创业失败后到了一家跨境电商公司,如果从履历上来看会觉得这个人没有定性,做得很杂。问他觉得哪份哪份工作对自己的影响最大,他选择了O2O这家,因为在这家开始接触数据分析。
“当时因为是第一份正式工作,特别希望有人带自己,但当时条件并不允许,所以就自己去学习,包括买书或者去找一些认识的业内大咖,每天抽出超过3个小时看这方面的书籍,周六日谢绝社交,泡图书馆、咖啡馆,或者问一些同行,“看书时一个人独处的时间较多,假如内心不够强大不下,不喜欢孤独的话,就可能觉得很没趣,看书可以静下心来想一些事情,包括自己想做什么,自己擅长什么”。
谈到自己的学习路径,刚开始先掌握的工具是Excel,会用类似Vlookup、VBA和数据透视表一些比较高阶的工具和函数做简单数据统计和分析,后来机(bei)缘(ren)巧(wa)合(qu)加入新浪微舆情做文本数据分析,开始系统学编程、Python之类的课程,因为国内这方面的课程比较少,就尝试学斯坦福、牛津大学等知名大学的相关课程,并且通过Google搜索关键词去找英文资料打印出来学习。他说当时学得比较艰难,涉及到很多理论性知识,包括统计学、微积分,就去回看大学时的课本,高等数学、概率论等理论知识,再后来一些学编程框架,反复在实践和理论琢磨。怕自己闭门造车,就去跟圈子一些大咖和志同道合的朋友打交道,看他们研究什么东西,避免自己跟业务脱节。
04.
实干派和理论派结合的行动家
在“文科生转型数据分析之旅”课程结尾,他写到“不能落地的分析都是扯淡的数据分析”。问到原因,他举例了《【万字干货】以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程》这篇文章。“当时在想假如把文章抓取下来做怎样的分析和洞察,我提出一些问题,把这些问题分解为两个方面,第一方面是描述性分析,包括文章写作分布,一段时间文章的发布量来评价运营规律,还统计一些作家的发文情况,地域分布等,文章里提到的地域跟热度分布的关系;第二方面就是内容的挖掘,包括一些关键词统计,文章标题的情感分析,包括主题分析,4w文章涉及到哪些主题、互联网百强公司在互联网领域的影响力等。(感兴趣的童鞋可以关注“运营喵是怎样炼成的”查看完整文章)
“虎嗅”发文数量、评论量和收藏量的变化走势
“虎嗅”收藏量和评论量的变化趋势
“虎嗅”发文时间规律分析
城市提及分布
互联网百强公司的共现分析
05.
少有人走的路,每一步都算数
《少有人走的路》是高老师印象最深的一本书,他说看完这本书发觉自己做得很不足,还说了这本书在自己低谷期的时候给自己带来很大的鼓舞。问到对自己影响最大的人,他提到了自己在跨境电商公司的老板,说这位老板是个东北汉子,特别豪爽,要是出现什么问题就会在大庭广众之下对他进行劈头盖脸的大骂,刚开始特别难受。后来这位老板对他说过一句话让他印象深刻:“长宽,要是哪天我不骂不是你特成功,就是你无药可救了。”
他觉得这是自己成长进步最快的一段时间。在这家公司尝试了包括运营、品牌、谈业务、数据分析,慢慢发现了自己在数据分析有优势并且能玩出花样,写的文章也得到了一些人的认可,开始坚持做数据分析,直到后来渐渐觉得自己不适合这个公司了,毅然决然选择了裸辞。这个时候新浪微舆情的CEO刚好看到他写的一篇文章,而这篇文章所用到的工具恰恰就是新浪微舆情的产品——微博事件分析,觉得他对产品的理解十分透彻,CEO就约他出来喝茶聊天,后来他就加入了新浪微舆情。高老师十分感激这位新浪微舆情的CEO,认为这位CEO用人极具魄力,敢于任用他这样之前没有专业背景的人,而且积极引导,是他前进进路上的指路人和伯乐。
到最后问到他未来的职业规划,还以为他会说一个很宏大的小目标,结果高老师还是很踏实的说道“首先是在数据相关的行业发展,然后不会局限于某个岗位,只要是能用数据发现洞察能够指导业务发展的都会去做,未来的事情说不准,毕竟互联网三个月一小变,三年一大变,我会继续关注物联网、人工智能领域,尽量从偏技术性的东西逐渐到行业的理解,再到后面具有管理者的一个思维”。