当前位置: 首页 > wzjs >正文

天津市建设工程网站安徽省建设工程信息网官方网站

天津市建设工程网站,安徽省建设工程信息网官方网站,百度网站优化软件,百度指数的数据来源前两篇文章《Node.js和Puppeteer进行Web抓取的简单使用》 和《Puppeteer结合Jest对网页进行测试》已经了解到Puppeteer大致可以做点什么事情,之前提到过最终自动化需要一个数组配置。这篇文章将会简单是一个读取配置文件实现自动化的脚本。 脚本 就拿《Node.js和P…

前两篇文章《Node.js和Puppeteer进行Web抓取的简单使用》 和《Puppeteer结合Jest对网页进行测试》已经了解到Puppeteer大致可以做点什么事情,之前提到过最终自动化需要一个数组配置。这篇文章将会简单是一个读取配置文件实现自动化的脚本。

脚本

就拿《Node.js和Puppeteer进行Web抓取的简单使用》 代码举例:

const puppeteer = require(‘puppeteer’);
let scrape = async () => {
// 打开一个浏览器const browser = await puppeteer.launch();// 新建一个页面const page = await browser.newPage();   // 打开urlawait page.goto(‘https://www.johancruijffarena.nl/calendar.htm');   // 针对某个元素 获取数据const result = await page.evaluate(() => {var data = [];var tables = document.querySelectorAll(‘table’);data = tables.length;     return data;}, );   // 关闭浏览器browser.close();return result
}
scrape().then((value) => {console.log(value);
});

这个就是日常mk代码逻辑,如果要转换配置化,那就先理清步骤,然后对配置数据建模。

开始构建数据、纯函数

从代码看出来,可以列出步骤如下:
步骤1: 打开一个浏览器;
步骤2: 新建一个页面;
步骤3: 打开url;
步骤4: 针对某个元素 获取数据;
步骤5: 关闭浏览器
可以看出每个步骤都是一个操作类型,这个时候,数据里面可以定一个操作类型的key:nodeType;

{nodeType: any
}

步骤1

因为一个流程只操作一个浏览器,因此配置数据可以省略这个步骤,当程序运行时默认执行这个步骤就好了,同时帮步骤1操作提取一个函数(尽量保证是一个纯函数,后续会有篇幅),

const getBrowser = async () => {const browser = await puppeteer.launch();return browser
}

步骤2和步骤3

步骤2和步骤3可以合并成一个步骤,打开一个页面,那必须得跳转url吧!那么可得到一个配置数据:

{nodeType: 'start',url: 'https://www.johancruijffarena.nl/calendar.htm'
},

创建一个只打开页面的纯函数:

const runNodeStart = async (arg) => {const { browser, task } = argconst { url } = taskconst page = await browser.newPage()await page.goto(url, {waitUntil: 'domcontentloaded',});return page
}

步骤4

该操作也得定义nodeType,告诉程序该做什么事情,因为需要检索元素需要关键字,可以设置selector为key

{nodeType: 'pick',selector: 'table'
}

函数:

const getPick = async (arg) => {const {  task } = argconst { selector } = taskconst result = await page.evaluate(() => {var data = [];var tables = document.querySelectorAll( selector );data = tables.length;     return data;}, );   return  result
}

步骤5:

同理可以得到一个配置数据:

{nodeType: 'close',
},

一个函数:

const runClose = async (arg) => {const { browser, task, page } = argawait browser.close();return false
}

配置数据如下

const datas = [
{. // 打开页面 nodeType: 'start',url: 'https://www.johancruijffarena.nl/calendar.htm'
},
{ // 获取数据nodeType: 'pick',selector: 'table'
},
{ // 关闭浏览器nodeType: 'close',
},
]

MK代码实现

其实一看数据配置就是一个数组,只要我们遍历这个数组,就可以完成我们配置自动化的效果。for循环简单粗暴:

const main = async () => {
const browser = await  getBrowser()
const len = datas.length
let page = null
let pickData = ''
for (let i = 0; i < len; i++) {const { nodeType } = datas[i]if (nodeType === 'start') {const data =   await  runNodeStart( { browser, task: datas[i]})page = data.page} else if (nodeType === 'pick') {pickData = await  getPick( { browser, task: datas[i], page} )} else if (nodeType === 'close') {await runClose({browser})}
}
}

当然这块代码,还是有很大的优化空间,必须实现功能较全的自动化,通过for、if、else if去实现,代码不太优雅!!!各位有啥想法不?优雅的优化方式!!!
相关源码


文章转载自:

http://F701HWyO.rnksg.cn
http://8NxRoYUy.rnksg.cn
http://u1XuL3oF.rnksg.cn
http://aAoBY16q.rnksg.cn
http://GL0A1WvF.rnksg.cn
http://GZ5hjeA2.rnksg.cn
http://QrN1DCVE.rnksg.cn
http://Qf1VfJBl.rnksg.cn
http://X2aYx4pD.rnksg.cn
http://Gf2Jz9cH.rnksg.cn
http://JlSIyLyW.rnksg.cn
http://GaEtuQBY.rnksg.cn
http://Cr0aBt14.rnksg.cn
http://B08gFF03.rnksg.cn
http://rWlHKJyW.rnksg.cn
http://BCKWljz6.rnksg.cn
http://WCVWNJe2.rnksg.cn
http://OIcbbwpH.rnksg.cn
http://t824oTX2.rnksg.cn
http://AQ2248nj.rnksg.cn
http://PwLDtB65.rnksg.cn
http://uBOCyeRu.rnksg.cn
http://s8tzs1g8.rnksg.cn
http://sLy1Chhv.rnksg.cn
http://knad6p43.rnksg.cn
http://L0sSAHNK.rnksg.cn
http://fLtaDouC.rnksg.cn
http://uzOnxI5d.rnksg.cn
http://v3VKOPyh.rnksg.cn
http://iyhT10AX.rnksg.cn
http://www.dtcms.com/wzjs/717703.html

相关文章:

  • 用服务器ip做网站页面免费域名注册查询
  • ink域名网站网站建设费能入长期待摊吗
  • 哪里建设网站最好用找手工活做注册网站
  • 京东快递 网站建设特点佛山网站专业制作
  • 广州网站建设哪家技术好广告设计培训机构
  • wordpress全站301南宁网站建设科技公司
  • 定州网站制作多少钱火山软件开发平台
  • 专业网站建设哪里好怎么修改WordPress为中文
  • 水产网站源码网站建设心得总结
  • 做网站为什么需要花钱信誉好的高密网站建设
  • 网站制作性价比哪家好摄影网站建设流程
  • 怎么成立个人网站网站怎么做 吸引人
  • 襄阳网站建设外包做黄金的经常看什么网站
  • 福州市晋安区建设局网站9免费网站空间
  • 徐州seo网站推广珠海网站建设平台
  • wordpress收不到网站首饰网站模板
  • 天津市建设厅注册中心网站长春在线制作网站
  • 做百度推广的网站吗著名的国外设计网站
  • 公司做网站的目的关键词歌曲歌词
  • 网站制作400哪家好网站添加什么东西才能和用户体验
  • 银川企业网站建设wordpress注册取消邮箱
  • 如何做微信ppt模板下载网站秦皇岛网站建设企业
  • 江苏建设科技网站代码高亮wordpress
  • 南阳建设网站制作大理州住房和城乡建设部网站
  • 网站被黑了怎么恢复企业网站优化电话
  • 互动网站设计与制作哈尔滨网站设计公司
  • 通化网站推广wordpress首页摘要设置
  • 温岭哪里有做网站的关键词搜索工具
  • 黄冈网站建设wordpress 随机阅读数
  • 手机网站吧wordpress免费中文主题