全自动水位控制器:用Feed43把网站页面转换为RSS feed - Le blog de Paradis - 歪酷博客 Ycool.com

来源:百度文库 编辑:中财网 时间:2024/04/30 00:03:42

今天刚从dream4ever.org知道feed43.com,体验了一把,感觉不错,参照了原作者alon的教程,与各位分享。

没用过RSS的不知道它的好,但是喜欢的网站不支持RSS订阅怎么办?用feed43.com就可以了,把web页面转换成RSS feed。

转换成RSS可以方便的通过RSS订阅通知我一个原本不支持RSS的站点,更方便更快捷。

这里我以http://www.buzzc.com/blogs/作为例子

登陆feed43.com ,选择Create your own feed进入

Step 1. Specify source page address (URL)
选择你想转换的Web页面地址,然后Reload后生成页面代码

Address: http://www.eve-online.com.cn/news/index.htm
Encoding: UTF-8

注意:在输入Address后点Reload按钮,如果下面的Page Source不显示乱码,那么Encoding不指定也可以。一般默认为gb2312,自己可以通过察看欲转换页面的源代码的开头处,

Step 2. Define extraction rules
定义模板规则,然后Extract后生成抓到的数据

Global Search Pattern: {%}
Item (repeatable) Search Pattern*:

{%}

{%}

{%}[全文]

重点在于Search Pattern的填写,可以观察上面生成的页面代码找到规律,我们发现每一条标题的代码都是类似如下的。

标题

内容[全文]


只要把内容部分用{%}替代即可。 Extract后生成的数据如下:

Item 1

{%1} = http://feeds.feedburner.com/PlayinWithIt?m=1380
{%2} = 出租车司机倪亚四
{%3} = 发表于 3 小时 之前
{%4} = 你愿不愿意相信 ...
{%5} =
http://feeds.feedburner.com/PlayinWithIt?m=1380

Item 2
...
我们可以看到模板中定义的{%}会自动换成{%1}{%2}{%3}

Step 3. Define output format
利用上面生成的{%1}{%2}{%3}...来定义输出的格式

RSS feed properties
Feed Title: buzzc.com-BLOG
Feed Link:
http://www.buzzc.com/blogs/
Feed Description: 汇集最热门blogs

RSS item properties
Item Title Template*:
{%2}-{%3}
Item Link Template*: {%1}
Item Content Template*: {%4}

这里我们把{%2}设定为标题,{%1}设定为链接,{%3}设定为时间,{%4}设定为内容,点击Preview预览。

Step 4. Get your RSS feed
最后生成RSS Feed地址:
http://feed43.com/8111237031053827.xml,然后就可以用各类RSS阅读器(例如GreatNews)订阅访问了。

最后对其进行处理,需要为注册用户:
Change file name of this feed to make it more user-friendly--修改RSS Feed的地址名称
Change feed edit password [?]--设定密码
Make this feed private [?]--在个人栏目里显示 Feed43默认不需要注册即可制作feed并使用

本文修改自:https://dream4ever.org/showthread.php?t=99881