“当网站内容有更新时发邮件提醒我”——利用feed43&
发邮件告诉你:研究生考试报名开始了!公务员招考报名开始了!会计从业资格证考试报名开始了!职称英语考试开始了!……
这些考试一年就一次或两次,每年报名的时间都不一样,一不留神就会错过报考时间。现在,利用feed43和ifttt这两样神器,一旦报名信息发布,我们的邮箱就能收到邮件提醒,再也不怕错过了!也不用每天登陆网站查看了!
简单实例
获取湖南公务员考试网上新发布的招考信息
解决思路:获得该网站的rss订阅源,订阅源有更新时自动发一封邮件到指定邮箱。但是该网站并没有提供rss订阅地址,我们需要通过Feed43自制一个rss feed,再利用IFTTT进行邮件推送。
所需工具:Feed43、IFTTT
前置知识:需要了解一点html知识
解决措施
步骤一、获取订阅源——Feed43
登陆 Feed43,单击 Create your own feed 进入
- ① 输入页面地址:http://www.gkz6.net/baokao/。
- ② 输入页面编码:gb2312。单击 Reload,可看到Step2 。
Step 1. Specify source page address (URL) 我们的目的是检测招考信息的增加,所以找到招考信息链接代码:
Step 2. Define extraction rules - ③ 输入搜索范围:
<ul id="alist">{%}</ul>
。可不填,不填会搜索整个页面。
网页上的招考信息链接有很多条,我们可以发现它们的代码都是类似的,归纳总结后,定义模板如下:
- ④ 输入条目搜索规则:
<li><div><a href="{%}">{%}</a>{*}</small>{%}</em> {%}</div></li>
3-4步的意思是:在<ul id="alist"></ul>
块状元素范围内,找到<li><div><a
,让紧跟的 href
双引号内容成为第一个参数,<a>
标签的文本内容成为第二个参数,</small>
前面的内容任意,</em>
前的内容成为第三个参数,</div>
前的内容成为第四个参数。{%}代替你希望得到的信息,比如招考信息标题,发布时间等;{}代替任意内容。*
单击 Extract,得到如下Item
- ⑤ 输入条目的标题格式:
{%2}({%4}){%3}
。 - ⑥ 输入条目的链接地址:
{%1}
单击 Preview 后的页面表现为:
步骤二、订阅源的更新发送到邮箱——IFTTT
突然不想写了呢。简单提一下,IFTTT的机制是“if this then that”,进入网站后,傻瓜式操作——“if RSS更新 then Email”,订阅源更新时,IFTTT就会把更新内容发你在IFTTT的注册邮箱了。
当然,步骤一中,实际操作时会碰见不少问题,例如:
- 在第①步时,怎样选取一个最合适的页面。网站主页上有招考信息,从主页上点进“更多招考信息”的页面上也有招考信息,选取哪一个最有利于后续的RSS化呢?
- 在第②步时,如何知道该页面的Encoding是什么?Encoding就是页面
<meta>
标签里的charset
属性的值,按F12可查看页面的html编码。 - ③、④步定义模板规则是重难点,只可意会,不可言传。一点经验之谈是:先用
{%}
替换你希望得到的内容,再运用好{*}
对html代码的替换。以后我会多上传几个例子让大家自己体会。
下次再写一个复杂一点的案例:当所需内容在<iframe>
元素里时该怎么办?Feed43无法直接从<iframe>
里提取item。比如实现这个功能:当湖南会计信息网发布会计从业资格证报考讯息时给我发邮件。