大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
采集列表页只要是为了获取对应内容页的链接
在江阴等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供网站制作、成都网站制作 网站设计制作按需网站制作,公司网站建设,企业网站建设,品牌网站建设,全网整合营销推广,成都外贸网站建设,江阴网站建设费用合理。
获取到内容页链接后 然后使用正则匹配 你要采集的信息
采集原理 可以参考(获取列表页的所有图片)
添加节点:
选择要增加采集的栏目:
进入增加节点表单:
在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:
下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:
6
这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:
7
把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:
进入数据库后,找到你存放数据的那个表,因为一旦修改的时候出现错误的话,你又不知道改回来后果是很严重的,建议大家先备份这个表的数据,我来里以表‘phome_ecms_news’为例,因为我的数据还没入库所以真实要修改的数据是‘phome_ecms_infotmp_news’,一定要找对表哦,别乱改。下图是我所找到的临时数据对应的表的部分截图。
核对好数据后只要写sql语修改表里的对应字段的内容信息就可以了,比如我要修改‘newstime’发布时间字段,把有含有‘2014-03-15’改成‘2012-03-15’只要写这样的sql语句
update phome_ecms_infotmp_news set newstime=replace(newstime,'2014-03-12','2012-03-12')
WHERE newstime like '%2014-03-12%' ,点击SQL,再点击UPDATE如下图
把刚刚写的好sql语句放在上图中 2 所示的输入框里,原来有的语句要删除哦 ,如下图,再点击下图中的‘执行’按钮
出现下图后点击图中我用红框标出的地方 ‘创建 PHP 代码’
点击 ‘创建 PHP 代码’ 后出现下图了,再点击下图中的 ‘执行’按钮,要往下面拉一点哦,不然可以看不到这个 按钮
6
现在再看看这个数据表里的 时间字段 里的内容,是不是改了,如果你想改标题,只要把上面的sql语句表名,和字段名改对就行了。