当前位置: 首页 > news >正文

可以免费发布招聘网站课程资源网站开发

可以免费发布招聘网站,课程资源网站开发,yy头像在线制作网站,wordpress文字转图插件下载javaselenium(资源全备,打开已使用浏览器信息,保留用户信息) 一、介绍 我的代码可以实现以下效果: 保留用户信息,好处:可以在登录好一个账号后还保留原来的token验证信息 使用javaselenium实现爬取vue元素内容&…

java+selenium(资源全备,打开已使用浏览器信息,保留用户信息)

一、介绍

我的代码可以实现以下效果:

保留用户信息,好处:可以在登录好一个账号后还保留原来的token验证信息

使用java+selenium实现爬取vue元素内容,获取里面的视频,图片信息等

我使用的jdk是17版本,你们如果用自己版本不行就使用我一样版本的jdk再试试

二、准备

1.坐标
            <dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>3.141.59</version></dependency>
2.下载Chrome及驱动
–下载地址

Chrome for Testing availability

–注意事项

在这个网址里面包含了,驱动以及浏览器下载

你选一个喜欢的版本下载就是了,注意下载两个东西

chrome,chromedriver,下载时注意电脑是32,还是64位

如果你的电脑包含了chrome,那你打开右上角三个点,选择帮助,选择关于浏览器,然后就能看到电脑浏览器的版本以及位数

你就下载对应的chromedriver就行了

–旧版本地址

版本在114及以下:http://chromedriver.storage.googleapis.com/index.html

三、代码

1.测试

下载后将驱动的存放地址放进来,运行后打开了浏览器,就代表成功了

package com.ruoyi.catai;import org.openqa.selenium.chrome.ChromeDriver;public class VueScraper {public static void main(String[] args) {// 设置ChromeDriver路径System.setProperty("webdriver.chrome.driver", "E:\\Project\\b-dimension\\b-dimension\\b-dimension\\b-fictiontweet\\src\\main\\java\\com\\ruoyi\\catai\\chromedriver-win64\\chromedriver.exe");//打开浏览器ChromeDriver chromeDriver=new ChromeDriver();//访问百度chromeDriver.get("http://www.baidu.com");}
}
2.方法
–8个方法

findElement(By.id())
findElement(By.name())
findElement(By.className())
findElement(By.tagName())
findElement(By.linkText())
findElement(By.partialLinkText())
findElement(By.xpath())
findElement(By.cssSelector())

–使用案例

​ 这是一个模拟登录的使用案例,还提供怎么获取多个元素集合

​ []这个是用于属性的等值匹配的

 // 使用CSS选择器定位class为el-input__inner且type为text的元素WebElement usernameInput = driver.findElement(By.cssSelector(".el-input__inner[type='text']"));// 输入用户名usernameInput.sendKeys("xxx");            // 定位用户名输入框,需要根据实际页面元素的 ID、name、class 等属性进行调整// 定位密码输入框,同样需要根据实际页面元素进行调整//WebElement passwordInput = driver.findElement(By.id("password"));WebElement passwordInput = driver.findElement(By.cssSelector(".el-input__inner[type='password']"));// 输入密码passwordInput.sendKeys("xxx");// 定位登录按钮,根据实际页面元素进行调整WebElement loginButton = driver.findElement(By.cssSelector(".el-button[type='button']"));// 点击登录按钮loginButton.click();// 等待登录完成,可以根据实际情况调整等待时间Thread.sleep(10000);*///driver.get("https://aigcbus.com/home/drawing");List<WebElement> mebox = driver.findElements(By.cssSelector(".message_box"));System.out.println(mebox.size());

四、优化

1.保留用户信息

上面的代码每次都是打开新的浏览器,之前的使用记录也没有,非常麻烦

我就通过保存浏览器的信息到本地文件夹,每次打开就读取对应用户信息

package com.ruoyi.catai;import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.HashSet;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class VueScraper {public static void main(String[] args) {WebDriver driver = null;try {//杀死占用该端口的进程,避免之前打开后的残留进程影响程序closeProcess("9222");Thread.sleep(1000);//运行浏览器在9222端口,指定保存和读取用户信息的文件夹String fullCommand = "cmd /c \"C: && cd /d C:\\Program Files\\Google\\Chrome\\Application && chrome.exe --remote-debugging-port=9222 --user-data-dir=\"D:\\chrome_temp\"\"";// 合并命令Runtime.getRuntime().exec(fullCommand);// 不等待 Chrome 进程结束,让 Java 程序继续执行// int exitCode = process.waitFor();// if (exitCode != 0) {//     throw new RuntimeException("命令执行失败,退出码: " + exitCode);// }System.out.println("Chrome 浏览器已启动");// 设置 ChromeDriver 的路径System.setProperty("webdriver.chrome.driver", "E:\\Project\\b-dimension\\b-dimension\\b-dimension\\b-fictiontweet\\src\\main\\java\\com\\ruoyi\\catai\\chromedriver-win64\\chromedriver.exe");// 创建 ChromeOptions 对象,可用于设置浏览器选项ChromeOptions options = new ChromeOptions();//设置自动化工具打开的浏览器地址,为本机9222端口的浏览器options.setExperimentalOption("debuggerAddress", "127.0.0.1:9222");// 禁用一些不必要的浏览器功能,提高性能options.addArguments("--disable-gpu","--no-sandbox");// 创建 ChromeDriver 实例driver = new ChromeDriver(options);// 打开目标网页driver.get("https://www.baidu.com");// 等待页面加载完成,可以根据实际情况调整等待时间Thread.sleep(5000);/*// 使用CSS选择器定位class为el-input__inner且type为text的元素WebElement usernameInput = driver.findElement(By.cssSelector(".el-input__inner[type='text']"));// 输入用户名usernameInput.sendKeys("xxx");            // 定位用户名输入框,需要根据实际页面元素的 ID、name、class 等属性进行调整// 定位密码输入框,同样需要根据实际页面元素进行调整//WebElement passwordInput = driver.findElement(By.id("password"));WebElement passwordInput = driver.findElement(By.cssSelector(".el-input__inner[type='password']"));// 输入密码passwordInput.sendKeys("xxx");// 定位登录按钮,根据实际页面元素进行调整WebElement loginButton = driver.findElement(By.cssSelector(".el-button[type='button']"));// 点击登录按钮loginButton.click();// 等待登录完成,可以根据实际情况调整等待时间Thread.sleep(10000);*///driver.get("https://aigcbus.com/home/drawing");List<WebElement> mebox = driver.findElements(By.cssSelector(".message_box"));System.out.println(mebox.size());// 使用findElements获取所有匹配的图片元素List<WebElement> imgList = driver.findElements(By.cssSelector(".el-image__inner[style='object-fit: cover;']"));//WebElement imgList = driver.findElement(By.cssSelector(".el-image__inner[style='object-fit: cover;']"));imgList.forEach(img -> {// 获取图片的src属性String src = img.getAttribute("src");System.out.println("图片地址:" + src);});} catch (Exception e) {e.printStackTrace();} finally {// 关闭浏览器driver.quit();}}/*public static void killProcessOnPort(int port) throws IOException, InterruptedException {// 查找占用指定端口的进程 IDString command = "netstat -ano | findstr :"+ port;Process process = Runtime.getRuntime().exec(command);BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()));String line;while ((line = reader.readLine()) != null) {if (line.contains("LISTENING")) {// 提取 PIDString[] parts = line.trim().split("\\s+");String pid = parts[parts.length - 1];// 杀死进程String killCommand = "taskkill /F /PID " + pid;Process killProcess = Runtime.getRuntime().exec(killCommand);int exitCode = killProcess.waitFor();if (exitCode == 0) {System.out.println("成功杀死占用端口 " + port + " 的进程,PID: " + pid);} else {System.out.println("杀死占用端口 " + port + " 的进程失败,PID: " + pid);}}}reader.close();}*/public static void closeProcess(String port){String command = "netstat -ano | findstr :" + port;try {// 执行命令Process process = Runtime.getRuntime().exec(new String[]{"cmd.exe", "/c", command});// 获取命令完成后输出BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()));String line;//匹配pid内容规则Pattern pattern = Pattern.compile("\\s+(\\d+)$");//接收PID集合HashSet<String> set = new HashSet();while ((line = reader.readLine()) != null) {Matcher matcher = pattern.matcher(line);if (matcher.find()) {// 提取并打印PIDString pid = matcher.group(1);set.add(pid);}}//遍历关闭对应pidset.forEach(s-> {try {System.out.println("pid:"+s);Process process1 = Runtime.getRuntime().exec(new String[]{"cmd.exe", "/c", "taskkill","/PID",s,"/F"});} catch (IOException e) {throw new RuntimeException(e);}});// 等待进程结束process.waitFor();reader.close();} catch (IOException | InterruptedException e) {e.printStackTrace();}}
}
2.总结

通过Java执行cmd命令打开谷歌浏览器,并指定保存用户信息的路径,也是读取用户信息的路径

自动化工具进入打开的这个谷歌浏览器,就能够实现,保留之前的登录信息了,无需再输入密码

http://www.dtcms.com/a/502087.html

相关文章:

  • 上海中学门户网站宝安自适应网站建设
  • 中国工程建设信息网站网站如何留住用户
  • 简述获得友情链接的途径网站优化需要工具
  • 天王手表官方网站自学做网站界面
  • 怎样才能创建网站青岛做网站哪家公司好
  • 德阳建设局网站wordpress 站点主页
  • 请别人做网站签订合同人才网最新招聘信息网
  • 佛山建网站永网网页美工设计的工作流程?
  • 深圳万齐创享网站建设从零开始建网站
  • 北京 网站策划公司物流网站做那个好
  • php 网站开发 pdf账号seo是什么
  • 昆明做网站哪家公司好app设计案例
  • 建网站可以赚钱吗定制开发软件图片
  • 哪些网站推广公司wordpress主题房
  • 电子商务网站建设与管理小论文2345网址导航电脑版下载
  • 北京做网站一般多少钱优化设计答案四年级上册语文
  • 零食网站建设前的市场分析苏州网络营销推广多少钱
  • 青海省公路建设服务网站app十大免费下载排行榜
  • 云虚拟主机做网站wordpress 上传时发生了错误
  • 广州网站推广软件网站开发简答题
  • 建设银行网站查询密码怎么设置大气的公司名字
  • 做淘宝门头的网站深圳网站开发哪家专业
  • 焦作网站开发公司好动词做的网站能行吗
  • iis7 网站权限设置做仿网站的书
  • 用腾讯云做网站的好处网站策划方案800字
  • 丹东站申请免费的个人网站
  • 建站推广外包做网站类网站费用
  • 做竞价可以让网站提高快速排名吗传奇服务器如何做网站
  • 学校网站建设厂家网站cms系统 开源框架
  • 广州建网站腾虎建设集团有限公司简介