博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HtmlUnitDriver 网页内容动态抓取
阅读量:5094 次
发布时间:2019-06-13

本文共 1037 字,大约阅读时间需要 3 分钟。

#抓取内容WebDriver driver = new HtmlUnitDriver(false);driver.get(url);String html = driver.getPageSource();#如何想等待一会元素渲染完毕driver.manage().timeouts().implicitlyWait(2, TimeUnit.SECONDS);
#进行百度搜索public static void doSearch(String keyword) {  final String url = "http://www.baidu.com";  WebDriver driver = new HtmlUnitDriver(false);  driver.get(url);  driver.findElement(By.id("kw")).sendKeys(keyword);  Actions action = new Actions(driver);  action.sendKeys(Keys.ENTER).perform();  System.out.println(driver.getPageSource());}

1 Selenium可支持的【真实】浏览器驱动:

  PC端驱动:firefox、safari、、、 driver

  移动端驱动: 、、、  支持iphone、ipad、android、FirefoxOS【第三方】

 

  safari、ff都是以插件形式驱动浏览器本身的;ie、chrome都是通过二进制文件来驱动浏览器本身的;

  这些driver都是直接启动并通过调用浏览器的底层接口来驱动浏览器的,因此具有最真实的用户场景模拟,主要用于进行web的兼容性使用。

 

2 selenium可支持的【伪浏览器】驱动:

  HtmlUnit 、 

  它们都不是真正的在浏览器、都没有GUI,而是具有支持html、js等解析能力的类浏览器程序;这些程序不会渲染出网页的显示内容,但是支持页面元素的查找、JS的执行等;由于不进行css及GUI渲染,所以运行效率上会比真实浏览器要快很多,主要用在功能性测试上面。htmlunit是实现的类浏览器程序,包含在selenium server中,无需驱动,直接实例化即可;其js的解析引擎是Rhino。

转载于:https://www.cnblogs.com/printN/p/7223267.html

你可能感兴趣的文章
xcode 5.1安装vvdocument
查看>>
log4j:WARN No appenders could be found for logger
查看>>
Google翻译
查看>>
盖得化工--采集所有公司详细信息
查看>>
Logistic Ordinal Regression
查看>>
常用软件
查看>>
影响数据库访问速度的九大因素
查看>>
好玩的-记最近玩的几个经典ipad ios游戏
查看>>
MySQL更改默认的数据文档存储目录
查看>>
给出一个十六进制的数0xFF 0x80 (只有2“位”) 将其转换成有符号的一字节的十进制整数...
查看>>
替代微软IIS强大的HTTP网站服务器工具
查看>>
5、easyUI-菜单与按钮
查看>>
6.5 案例21:将本地数据库中数据提交到服务器端
查看>>
PyQt5--EventSender
查看>>
深入浅出Symfony2 - 结合MongoDB开发LBS应用
查看>>
android 通过AlarmManager实现守护进程
查看>>
Sql Server 中由数字转换为指定长度的字符串
查看>>
win7下把电脑设置成wlan热
查看>>
Java 多态 虚方法
查看>>
jquery.validate插件在booststarp中的运用
查看>>