全自动水位控制器:用Feed43把网站页面转换为RSS feed - Le blog de Paradis - 歪酷博客 Ycool.com
今天刚从dream4ever.org知道feed43.com,体验了一把,感觉不错,参照了原作者alon的教程,与各位分享。
没用过RSS的不知道它的好,但是喜欢的网站不支持RSS订阅怎么办?用feed43.com就可以了,把web页面转换成RSS feed。
转换成RSS可以方便的通过RSS订阅通知我一个原本不支持RSS的站点,更方便更快捷。
这里我以http://www.buzzc.com/blogs/作为例子
登陆feed43.com ,选择Create your own feed进入
Step 1. Specify source page address (URL)
选择你想转换的Web页面地址,然后Reload后生成页面代码
Address: http://www.eve-online.com.cn/news/index.htm
Encoding: UTF-8
注意:在输入Address后点Reload按钮,如果下面的Page Source不显示乱码,那么Encoding不指定也可以。一般默认为gb2312,自己可以通过察看欲转换页面的源代码的开头处,
Step 2. Define extraction rules
定义模板规则,然后Extract后生成抓到的数据
Global Search Pattern: {%}
Item (repeatable) Search Pattern*:
重点在于Search Pattern的填写,可以观察上面生成的页面代码找到规律,我们发现每一条标题的代码都是类似如下的。
只要把内容部分用{%}替代即可。 Extract后生成的数据如下:
Item 1
{%1} = http://feeds.feedburner.com/PlayinWithIt?m=1380
{%2} = 出租车司机倪亚四
{%3} = 发表于 3 小时 之前
{%4} = 你愿不愿意相信 ...
{%5} = http://feeds.feedburner.com/PlayinWithIt?m=1380
Item 2
...
我们可以看到模板中定义的{%}会自动换成{%1}{%2}{%3}
Step 3. Define output format
利用上面生成的{%1}{%2}{%3}...来定义输出的格式
RSS feed properties
Feed Title: buzzc.com-BLOG
Feed Link: http://www.buzzc.com/blogs/
Feed Description: 汇集最热门blogs
RSS item properties
Item Title Template*: {%2}-{%3}
Item Link Template*: {%1}
Item Content Template*: {%4}
这里我们把{%2}设定为标题,{%1}设定为链接,{%3}设定为时间,{%4}设定为内容,点击Preview预览。
Step 4. Get your RSS feed
最后生成RSS Feed地址:http://feed43.com/8111237031053827.xml,然后就可以用各类RSS阅读器(例如GreatNews)订阅访问了。
最后对其进行处理,需要为注册用户:
Change file name of this feed to make it more user-friendly--修改RSS Feed的地址名称;
Change feed edit password [?]--设定密码
Make this feed private [?]--在个人栏目里显示 Feed43默认不需要注册即可制作feed并使用。
本文修改自:https://dream4ever.org/showthread.php?t=99881