当前位置: 首页 > news >正文

上海网站建设q.479185700強牛什么网站建设

上海网站建设q.479185700強,牛什么网站建设,国内的搜索引擎排名,新东方雅思培训机构官网前两篇文章《Node.js和Puppeteer进行Web抓取的简单使用》 和《Puppeteer结合Jest对网页进行测试》已经了解到Puppeteer大致可以做点什么事情,之前提到过最终自动化需要一个数组配置。这篇文章将会简单是一个读取配置文件实现自动化的脚本。 脚本 就拿《Node.js和P…

前两篇文章《Node.js和Puppeteer进行Web抓取的简单使用》 和《Puppeteer结合Jest对网页进行测试》已经了解到Puppeteer大致可以做点什么事情,之前提到过最终自动化需要一个数组配置。这篇文章将会简单是一个读取配置文件实现自动化的脚本。

脚本

就拿《Node.js和Puppeteer进行Web抓取的简单使用》 代码举例:

const puppeteer = require(‘puppeteer’);
let scrape = async () => {
// 打开一个浏览器const browser = await puppeteer.launch();// 新建一个页面const page = await browser.newPage();   // 打开urlawait page.goto(‘https://www.johancruijffarena.nl/calendar.htm');   // 针对某个元素 获取数据const result = await page.evaluate(() => {var data = [];var tables = document.querySelectorAll(‘table’);data = tables.length;     return data;}, );   // 关闭浏览器browser.close();return result
}
scrape().then((value) => {console.log(value);
});

这个就是日常mk代码逻辑,如果要转换配置化,那就先理清步骤,然后对配置数据建模。

开始构建数据、纯函数

从代码看出来,可以列出步骤如下:
步骤1: 打开一个浏览器;
步骤2: 新建一个页面;
步骤3: 打开url;
步骤4: 针对某个元素 获取数据;
步骤5: 关闭浏览器
可以看出每个步骤都是一个操作类型,这个时候,数据里面可以定一个操作类型的key:nodeType;

{nodeType: any
}

步骤1

因为一个流程只操作一个浏览器,因此配置数据可以省略这个步骤,当程序运行时默认执行这个步骤就好了,同时帮步骤1操作提取一个函数(尽量保证是一个纯函数,后续会有篇幅),

const getBrowser = async () => {const browser = await puppeteer.launch();return browser
}

步骤2和步骤3

步骤2和步骤3可以合并成一个步骤,打开一个页面,那必须得跳转url吧!那么可得到一个配置数据:

{nodeType: 'start',url: 'https://www.johancruijffarena.nl/calendar.htm'
},

创建一个只打开页面的纯函数:

const runNodeStart = async (arg) => {const { browser, task } = argconst { url } = taskconst page = await browser.newPage()await page.goto(url, {waitUntil: 'domcontentloaded',});return page
}

步骤4

该操作也得定义nodeType,告诉程序该做什么事情,因为需要检索元素需要关键字,可以设置selector为key

{nodeType: 'pick',selector: 'table'
}

函数:

const getPick = async (arg) => {const {  task } = argconst { selector } = taskconst result = await page.evaluate(() => {var data = [];var tables = document.querySelectorAll( selector );data = tables.length;     return data;}, );   return  result
}

步骤5:

同理可以得到一个配置数据:

{nodeType: 'close',
},

一个函数:

const runClose = async (arg) => {const { browser, task, page } = argawait browser.close();return false
}

配置数据如下

const datas = [
{. // 打开页面 nodeType: 'start',url: 'https://www.johancruijffarena.nl/calendar.htm'
},
{ // 获取数据nodeType: 'pick',selector: 'table'
},
{ // 关闭浏览器nodeType: 'close',
},
]

MK代码实现

其实一看数据配置就是一个数组,只要我们遍历这个数组,就可以完成我们配置自动化的效果。for循环简单粗暴:

const main = async () => {
const browser = await  getBrowser()
const len = datas.length
let page = null
let pickData = ''
for (let i = 0; i < len; i++) {const { nodeType } = datas[i]if (nodeType === 'start') {const data =   await  runNodeStart( { browser, task: datas[i]})page = data.page} else if (nodeType === 'pick') {pickData = await  getPick( { browser, task: datas[i], page} )} else if (nodeType === 'close') {await runClose({browser})}
}
}

当然这块代码,还是有很大的优化空间,必须实现功能较全的自动化,通过for、if、else if去实现,代码不太优雅!!!各位有啥想法不?优雅的优化方式!!!
相关源码

http://www.dtcms.com/a/463433.html

相关文章:

  • 保定网站优化公司用ps如何做网站首页
  • 广西住房和建设厅官网泰州网站建设优化建站
  • 什么网站可以帮别人做数据分析赚钱网站小游戏怎么做的
  • 做网站的价视频制作和剪辑教程
  • 网站平台多少钱珠海企业网站设计公司
  • 互联网网站建设月总结中国桥梁建设公司排名
  • 塔里木油田公司档案馆网站建设研究济南建行网点
  • 青田网页设计公司英文网站排名优化
  • 湖南seo网站开发怎么自己在百度上做网站
  • 重庆做网站的公司给别人做网站能赚钱吗
  • 可控核聚变龙头-公司实力对比:东方精工、弘讯科技、久盛电气、国光电器、久立特材、安泰科技
  • 电商网站建设的意义电脑要登入国外的网站应该怎么做
  • linux创建新用户,并获取docker权限
  • 哪个设计网站做兼职好新网站建设代理商
  • 做分析图地图网站lisp 网站开发
  • 一些网站只能在微信打开怎么做的东莞网络推广运营企业
  • 找做外墙油漆网站视频背景音乐怎么做mp3下载网站
  • 个人备案做运营网站注册个网站域名多少钱一年
  • 四川住房建设网站免费电子商务网站模板
  • 企业网站建设研究目的意义精神文明建设网站模板
  • 数据库网站学校学网页设计
  • 电力建设监理招聘网站wordpress教程 gofair
  • CODESYS使用CAA File库进行文件操作的详细讲解
  • 南京seo网站标题优化技巧
  • 怎么开个人网站赚钱华夏建筑工程网
  • 江苏省电力建设一公司网站网络营销设计公司
  • 做网站能赚钱吗 知乎京东云擎 wordpress 二级域名
  • [xboard] 28 busybox最小根文件系统
  • 做细胞激活的母液网站推广渠道包括哪些
  • 山东大学青岛校区建设指挥部网站什么是网站建设策划书