大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
简单的分了几个步骤:
成都创新互联公司主营东西湖网站建设的网络公司,主营网站建设方案,成都app软件开发,东西湖h5小程序开发搭建,东西湖网站营销推广欢迎东西湖等地区企业咨询
1、确定采集目标
2、获取目标远程页面内容(curl、file_get_contents)
3、分析页面html源码,正则匹配你需要的内容(preg_match、preg_match_all),这一步最为重要,不同页面正则匹配规则不一样
4、入库
主要使用php抓取目标网页,然后进行字符串处理,分离出你想用的数据。
例如使用fopen()方法:
?php
$f = fopen($url,"r");
$html = "";
if($f){
while (!feof($f)) {
$html .= fgets($f);
}
//对$html进行处理,根据目标网页的结构,截取分离字符串
....
}
?
首先你是哪个步骤解决不了?
分析出谷歌图片地址路径
模拟用户请求下载图片保存到本地
对于第一个问题,就是 自己去看看源代码,有可能是ajax加载的,只要找到返回的html内容 分析出 图片地址即可。
第二个问题,php中可以直接用socket访问 也可以直接用curl库,推荐用curl库 比较高效稳定。
如果仍然没法搞定,欢迎到 自学去论坛 提出你的疑问