大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
用file_get_contents(文章页的链接);,然后用正则匹配指定标签里面的内容
网站建设哪家好,找创新互联公司!专注于网页设计、网站建设、微信开发、小程序开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了涿州免费建站欢迎大家使用!
微信服务器post数据是后台进行的,你直接print并截断是看不到信息的,另外post过来的数据是特殊的xml格式,可以写入日志查看
给个简单的例子,仅仅是获取了远程图片哦
?php
$url = '';这是你的微信网址
$con = file_get_contents("$url");
$pattern="/[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg|\.png]))[\'|\"].*?[\/]?/";
preg_match_all($pattern,$con,$match);
for($i=0;$count($match[1]);$i++){
$pic = file_get_content($match[1][$i]);
$name_arr = explode('/',$pic);
$n = count($name_arr);
file_put_content($name_arr[$n],$pic);
}
没做测试,你测试一下吧
可以尝试使用DOM操作库simple-html-dom.php,快速获取HTML结构的内容:
?php
require dirname(__FILE__).'/simple_html_dom.php';
$html = file_get_html('');
$articles = array();
foreach($html-find('article.newsentry') as $article) {
$item['time'] = trim($article-find('time', 0)-plaintext);
$item['title'] = trim($article-find('h2.newstitle', 0)-plaintext);
$item['content'] = trim($article-find('div.newscontent', 0)-plaintext);
$articles[] = $item;
}
print_r($articles);
可以把抓取到的内容写入置于内存上的SQLite(/run/shm/php/crawler.db3),避免频繁的磁盘IO.
使用fidder抓包工具抓一下数据链接
然后根据链接使用curl进行获取
把你微信文章的路由发过来看看,八成是用文件函数打开地址返回字符串然后正则匹配出结果去获取,但是不知道你的url地址是不是可以访问