python爬取js函数 python爬取jsp网页

python中如何调用js文件中的方法呢

1、打开pycharm开发工具，点击File菜单，选择Settings...，进行第三方模块安装；输入selenium，点击Install Package。

创新互联建站是专业的富平网站建设公司，富平接单;提供成都做网站、网站设计,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行富平网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!

2、接着在python项目的指定文件夹下，鼠标右键新建python文件，输入文件名并点击Python file。

3、打开新建的文件，依次导入selenium、webdriver和time。

4、调用webdriver模块中的Chrome()，使用get()获取对应网址的内容。

5、调用find_element_by_id()获取对应页面元素，然后调用按钮点击事件。

6、修改get()方法中的请求路径，然后保存代码并运行文件，查看运行结果。

抓取js动态生成的内容的页面有两种基本的解决方案

1用dryscrape库动态抓取页面

js脚本是通过浏览器来执行并返回信息的，所以，抓取js执行后的页面，一个最直接的方式就是用python模拟浏览器的行为。WebKit 是一个开源的浏览器引擎，python提供了许多库可以调用这个引擎，dryscrape便是其中之一，它调用webkit引擎来处理包含js等的网页！

2 selenium web测试框架

selenium是一个web测试框架，它允许调用本地的浏览器引擎发送网页请求，所以，它同样可以实现抓取页面的要求。

selenium + phantomjs 模拟点击按钮，或者另写代码实现js函数openVideo()；

顺着第一步再去解析新页面，看看能否找到视频的原始地址；

假设视频的原始地址第二步找到了，在通过视频的原始地址下载视频就OK啦。

一、查看相应的js代码，用python获取原始数据之后，模仿js编写相应的python代码。

二、通过接口api获得数据，直接使用python获取接口数据并处理。

三。终极方法。使用 Selenium和PhantomJS执行网页js代码，然后再获取数据，这种方法100%可以获取数据，确定就是速度太慢。

新闻标题：python爬取js函数 python爬取jsp网页
文章来源：http://dzwzjz.com/article/dojijhs.html