【R图秀-3】哪个国家最需要R程序员?

2016-08-03  本文已影响137人  Rapp

R的老用户们可能听说过R-users这个网站。公司和个人都可以在上面发布招聘信息,当然要招的大部分都是熟悉R语言的Data Scientist。
https://www.r-users.com

webpage.png

我偶尔会去R-users网站上看看Data Scientist的招聘职位和技能需求。很可惜的是,在上面几乎看不到中国公司发布的信息。于是我的脑海里闪现出一个问题:究竟哪个国家最需要R程序员呢?也许将来可以有机会去这些国家工作。

要想回答这个问题,首先要写个爬虫程序,收集R-users网站上所有招聘职位中的工作地点,然后做个简单的统计就可以了。具体来说,整个过程分成以下几个部分:

  1. 用rvest开发爬虫程序,自动收集网页中的工作地点(location)。统计每个工作地点出现的频数(Frequency),将整理好的数据保存待用。代码如下:


    code1.png
  2. 列举出频数最多的10个工作地点,用barplot展示。代码如下:


    code2.png

    这里用国旗来代表每个国家,看看你能认出几个国家,我觉得欧洲这几个3道杠的国旗太容易混淆了


    R_jobs_top10_countries.png
  3. 找到排名第一的国家后,再看该国家不同地域间的分布,用heatmap展示,代码如下:

code3.png

毫无疑问,R程序员在美国是最强手的,而纽约和加州又是排名全美的前2名。各位同学知道自己未来的方向了吧。


R_jobs_USA_map.png

今天的“R图秀”就到这里,如果想了解更多用R写爬虫的信息,可以关注本期的RTube:“用R自动抓取和分析网页”

qrcode.jpg
上一篇下一篇

猜你喜欢

热点阅读