当前位置: 首页 > wzjs >正文

荆门建网站费用广告图片素材

荆门建网站费用,广告图片素材,天河定制型网站建设,php网站挂马免责声明 本教程仅用于教育目的,演示如何合法获取公开专利数据。在实际操作前,请务必: 1. 仔细阅读目标网站的robots.txt文件和服务条款 2. 控制请求频率,避免对服务器造成负担 3. 仅获取和使用公开数据 4. 不用于商业用途或…

免责声明

本教程仅用于教育目的,演示如何合法获取公开专利数据。在实际操作前,请务必:

1.  仔细阅读目标网站的robots.txt文件和服务条款
2.  控制请求频率,避免对服务器造成负担
3.  仅获取和使用公开数据
4.  不用于商业用途或大规模抓取

本次教学网站:aHR0cDovL2VwdWIuY25pcGEuZ292LmNuL0FkdmFuY2Vk(请自行base64解密)。

本次实现需求:1.查询某固定日期之后的所有专利 2.将获取到的专利数据写入xlsx文件

本次使用语言:python

实现思路:DrissionPage实现自动化操作网页,向公布开始日期的输入框插入需要查询的日期(若需要其他查询条件思路与其基本一致),点击查询按钮跳转至专利数据列表页面,获取总计页面数量,循环总计页面数量,自动获取并向xlsx文件写入每一页数据,如果当前页不是最后一页,点击下一页继续获取数据并完成写入。

程序输出结果:

完整代码

from DrissionPage import ChromiumOptions, ChromiumPage
import re
from bs4 import BeautifulSoup
from DataRecorder import Recorderco = ChromiumOptions()
co.headless()  # 无头模式
# 创建页面对象,并启动浏览器
page = ChromiumPage(co)
# 跳转到页面
page.get('http://epub.cnipa.gov.cn/Advanced')
start_date = '2022.10.18'
r = Recorder(f'专利网_{start_date}.xlsx')
r.set.head(['标题', '申请公布号', '申请公布日', '申请号', '申请日', '申请人', '发明人', '地址', '分类号', '摘要'])
r.record()def save_data(datalist):r.add_data(datalist)r.record()# 定位到开始日期文本框,获取文本框元素
ele = page.ele('#pd_begin')
# 输入对文本框输入开始日期
ele.input(start_date)
# 定位到页面文本为“查询”的按钮并点击
search_button = page.ele('.icon-sea')
search_button.click()
page.wait(5)total_element = page.ele('css:.page_total')
total_content = total_element.text
# 正则提取页数
page_num = re.search(r'共 (\d+) 页', total_content).group(1)
print(f'总页数:{page_num}')  # 输出:总页数:****now_page = 1
max_page = int(page_num)
data_list = []def get_data():res = page.ele('#result')items = res.eles('css:.item')list_arr = []for item in items:title = item.ele('.title').textpublication_num = item.ele('.info').eles('tag:dd')[0].textpublication_date = item.ele('.info').eles('tag:dd')[1].textapplication_num = item.ele('.info').eles('tag:dd')[2].textapplication_date = item.ele('.info').eles('tag:dd')[3].textapplicant = item.ele('.info').eles('tag:dd')[4].textinventor = item.ele('.info').eles('tag:dd')[5].textaddress = item.eles('.intro')[0].eles('tag:dd')[0].texttype_num = item.eles('.intro')[1].eles('tag:dd')[0].textdes = item.eles('.intro')[2].eles('tag:dd')[0].textif item.eles('.intro')[2].eles('tag:dd')[0].ele('tag:p'):des_dom = item.eles('.intro')[2].eles('tag:dd')[0].ele('tag:p').htmlsoup = BeautifulSoup(des_dom, 'html.parser')for tag in soup.find_all(class_=['point', 'open j-open-alltxt']):tag.decompose()des = soup.get_text(strip=True).replace('\n', ' ')arr = [title, publication_num, publication_date, application_num, application_date, applicant, inventor,address, type_num, des]print(arr)list_arr.append(arr)save_data(list_arr)def get_page_data():if now_page == 1:get_data()else:next_button = page.ele('.next_page')page.wait(2)next_button.click()page.wait(3)get_data()for i in range(1, max_page + 1):now_page = iprint(f'正在获取第{i}页数据')get_page_data()page.quit()


文章转载自:

http://lhcXtIPr.qgLqb.cn
http://MUHwrziV.qgLqb.cn
http://5kkCgQjT.qgLqb.cn
http://lktWl1Tv.qgLqb.cn
http://2BsfeWu6.qgLqb.cn
http://FMK1fGID.qgLqb.cn
http://Mopl9tPP.qgLqb.cn
http://YMTARXwv.qgLqb.cn
http://rNCOUHtV.qgLqb.cn
http://7FBH1GQy.qgLqb.cn
http://JCF2CmnR.qgLqb.cn
http://sDsMTfrk.qgLqb.cn
http://8hjcPDJU.qgLqb.cn
http://nLma1uLo.qgLqb.cn
http://GpYxdxRo.qgLqb.cn
http://ugxNwbfN.qgLqb.cn
http://2kxYgpWz.qgLqb.cn
http://83EtZoQp.qgLqb.cn
http://UgqQAIgE.qgLqb.cn
http://HlvNQUzN.qgLqb.cn
http://a5Jd6hg0.qgLqb.cn
http://5sbEwTUA.qgLqb.cn
http://x7Y93vwj.qgLqb.cn
http://XGagWFjH.qgLqb.cn
http://JMoXCuOK.qgLqb.cn
http://kEeyuUAr.qgLqb.cn
http://8mGirezn.qgLqb.cn
http://3c3gKHdz.qgLqb.cn
http://3j207qmG.qgLqb.cn
http://n10gYbP0.qgLqb.cn
http://www.dtcms.com/wzjs/692209.html

相关文章:

  • 网站备案账号是什么样的网页设计与制作实训报告个人主页
  • 企业网站建设 电脑配置河南省建设厅网站地址
  • 免费快速建站网站vultr wordpress
  • 网站权重什么意思武隆网站建设报价
  • 柯桥建设局网站首页网络培训的收获与感受
  • 沈阳网站推广公司怎么建立公司网站?
  • 辽阳企业网站建设费用做刷赞网站能赚钱吗
  • 网站建设规划设计长春做企业网站多少钱
  • vs2013可以做网站么Git page wordpress
  • 网站建设怎么找客源那些公司做网站好
  • 网站建设与管理维护 李建青惠州的企业网站建设
  • 国外室内设计网站推荐上海公司做网站的
  • 做国外网站收款怎么收wordpress小说文章发布插件
  • 韶关做网站的公司做直播网站赚钱吗
  • 天津h5模板建站目前最主流的网页制作软件是
  • 外贸联系网站保险公司网站开发
  • 网站报404错误怎么解决网站怎么 备案
  • 男女做那事视频免费网站修改网站照片需要怎么做
  • 网站做端口是什么网站建设和运营
  • 人力资源公司网站模板下载怎么创网站赚钱吗
  • 如皋网站定制做网络推广的网站
  • 装饰公司取名长沙谷歌优化
  • 哪些网站可以做移动端模板企管宝app下载
  • jsp做网站毕业设计透明主题wordpress
  • 博达 网站群建设公司域名费用每年多少钱
  • 政务网站建设云计算中心旅游网站源码 wordpress模板 v1.0
  • 青岛做公司网站的公司制作网页需要什么技术
  • 如何把自己写的html变成网站漯河网页设计
  • 中建二局官网seo评测论坛
  • 北京做网站网站数据库有什么用