网站万能信息采集器

   ————让您从此不再为网站内容烦恼
    ————让您的网站一天内拥有海量信息
 
 

使用实例分析1--最简单的新闻例子

以下通过一个实例来说明软件的使用方法 ,这个实例的功能是采集新闻标题,设置起来非常简单,熟悉了这个过程,设置其它的就好办了。

基本操作:

查看网页源代码:
点击IE浏览器的查看,再点“源文件”。
网页编辑软件Dreamweaver的使用:
下载安装这个软件,打开软件后点击 三个按钮中最中间的这个,软件界面就分成了两大块,上面显示网页代码,下面显示网页的大致样子。我们经常要把网页源代码粘贴到Dreamweaver的代码区域,然后就可以看到网页的样子。学会这个,主要是为了找到信息的标识。

1.点击新建任务这个按钮,点击后会出现如下界面:

任务名称:随便起个名字,就叫最简单的新闻例子
任务起始地址:就是新闻列表的那个网址,http://info.china.alibaba.com/news/subject/v5003008-s5015020.html

2.切换到“采集对象网址标识”选项卡,设置标识



采集对象所在网页网址标识:就是新闻列表里,新闻内容的链接与该网页上其它链接的区别,我们可以看到新闻链接的网址里都有/detail这个字符串,其它网址里没有,因此此项就填写/detail。软件就会只抓含有/detail的网址,正是我们要抓的东西。别忘了要点击“添加标识”按钮添加进去哦。




3.切换到“采集对象前后标识”选项卡



信息名称:设置一个有意义的可以区分其它信息的名字,我们第一个要抓的是新闻标题,因此就叫“标题”,此处可以随便填写。

然后打开任何一条新闻,点Ie菜单查看--源文件,打开可以看到类似下面的源文件

很容易看到<title>与</title>之间的文字就是要抓的标题。信息前标就是<title>,信息后标就是</title>
设置好之后,点添加按钮。

好了,全部设置完毕,点击“更新任务设置”返回,然后点击载入任务,把“最简单的新闻例子”载入,并且选中。点击“开始”按钮开始采集,就可以看到采集到的新闻标题了,简单吧。