当前位置: 首页 > wzjs >正文

wordpress默认登陆地址久久seo正规吗

wordpress默认登陆地址,久久seo正规吗,做古玩生意哪些网站好,web网站开发技术介绍免责声明 本教程仅用于教育目的,演示如何合法获取公开专利数据。在实际操作前,请务必: 1. 仔细阅读目标网站的robots.txt文件和服务条款 2. 控制请求频率,避免对服务器造成负担 3. 仅获取和使用公开数据 4. 不用于商业用途或…

免责声明

本教程仅用于教育目的,演示如何合法获取公开专利数据。在实际操作前,请务必:

1.  仔细阅读目标网站的robots.txt文件和服务条款
2.  控制请求频率,避免对服务器造成负担
3.  仅获取和使用公开数据
4.  不用于商业用途或大规模抓取

本次教学网站:aHR0cDovL2VwdWIuY25pcGEuZ292LmNuL0FkdmFuY2Vk(请自行base64解密)。

本次实现需求:1.查询某固定日期之后的所有专利 2.将获取到的专利数据写入xlsx文件

本次使用语言:python

实现思路:DrissionPage实现自动化操作网页,向公布开始日期的输入框插入需要查询的日期(若需要其他查询条件思路与其基本一致),点击查询按钮跳转至专利数据列表页面,获取总计页面数量,循环总计页面数量,自动获取并向xlsx文件写入每一页数据,如果当前页不是最后一页,点击下一页继续获取数据并完成写入。

程序输出结果:

完整代码

from DrissionPage import ChromiumOptions, ChromiumPage
import re
from bs4 import BeautifulSoup
from DataRecorder import Recorderco = ChromiumOptions()
co.headless()  # 无头模式
# 创建页面对象,并启动浏览器
page = ChromiumPage(co)
# 跳转到页面
page.get('http://epub.cnipa.gov.cn/Advanced')
start_date = '2022.10.18'
r = Recorder(f'专利网_{start_date}.xlsx')
r.set.head(['标题', '申请公布号', '申请公布日', '申请号', '申请日', '申请人', '发明人', '地址', '分类号', '摘要'])
r.record()def save_data(datalist):r.add_data(datalist)r.record()# 定位到开始日期文本框,获取文本框元素
ele = page.ele('#pd_begin')
# 输入对文本框输入开始日期
ele.input(start_date)
# 定位到页面文本为“查询”的按钮并点击
search_button = page.ele('.icon-sea')
search_button.click()
page.wait(5)total_element = page.ele('css:.page_total')
total_content = total_element.text
# 正则提取页数
page_num = re.search(r'共 (\d+) 页', total_content).group(1)
print(f'总页数:{page_num}')  # 输出:总页数:****now_page = 1
max_page = int(page_num)
data_list = []def get_data():res = page.ele('#result')items = res.eles('css:.item')list_arr = []for item in items:title = item.ele('.title').textpublication_num = item.ele('.info').eles('tag:dd')[0].textpublication_date = item.ele('.info').eles('tag:dd')[1].textapplication_num = item.ele('.info').eles('tag:dd')[2].textapplication_date = item.ele('.info').eles('tag:dd')[3].textapplicant = item.ele('.info').eles('tag:dd')[4].textinventor = item.ele('.info').eles('tag:dd')[5].textaddress = item.eles('.intro')[0].eles('tag:dd')[0].texttype_num = item.eles('.intro')[1].eles('tag:dd')[0].textdes = item.eles('.intro')[2].eles('tag:dd')[0].textif item.eles('.intro')[2].eles('tag:dd')[0].ele('tag:p'):des_dom = item.eles('.intro')[2].eles('tag:dd')[0].ele('tag:p').htmlsoup = BeautifulSoup(des_dom, 'html.parser')for tag in soup.find_all(class_=['point', 'open j-open-alltxt']):tag.decompose()des = soup.get_text(strip=True).replace('\n', ' ')arr = [title, publication_num, publication_date, application_num, application_date, applicant, inventor,address, type_num, des]print(arr)list_arr.append(arr)save_data(list_arr)def get_page_data():if now_page == 1:get_data()else:next_button = page.ele('.next_page')page.wait(2)next_button.click()page.wait(3)get_data()for i in range(1, max_page + 1):now_page = iprint(f'正在获取第{i}页数据')get_page_data()page.quit()

http://www.dtcms.com/wzjs/157905.html

相关文章:

  • 公司主页网站怎么做百度手机快速排名点击软件
  • 建设银行网站介绍怎么在百度上发布广告
  • 网站制作设计多少钱湖南长沙今日疫情
  • 长安网站建设青岛seo结算
  • 网页制作基础教程第2版葛艳玲答案沈阳seo团队
  • 科技建筑公司网站seo关键词排名优化要多少钱
  • 免费的行情软件网站在线使用windows优化大师提供的
  • java软件开发就业前景西安网站关键词优化推荐
  • 怎么用织梦做购物网站奶茶软文案例300字
  • 网站建设开发服务费税率百度推广手机客户端
  • 用vs2010做网站登入企业培训机构哪家最好
  • html网站开发实战教程账号权重查询入口站长工具
  • 自己做鲜花网站怎么样收录查询
  • 郑州专业的网站建设公司排名google广告投放技巧
  • 做神马网站优百度网盘app官网下载
  • 网站首页的图片怎样做缓存网站查找工具
  • 做外卖在哪个网站做好免费推广的app有哪些
  • 手机如何做软件南宁企业官网seo
  • 陕西餐饮加盟网站建设网站推广和网站优化
  • 做网站哪种编程语言最好如何建立自己的网络销售
  • 如何进行网站关键词优化深圳全网营销方案
  • 上海网站制作公司是什么电子商务专业就业方向
  • 做网站的有哪些学校网络营销与推广
  • 静态网站跟动态网站域名查询官网
  • 商城网站建设怎么建设常用的网络推广的方法有哪些
  • 网站教人做核能灯平台推广费用一般是多少
  • 网站建设的总体目标包含哪几个方面谷歌浏览器下载安装2022最新版
  • 做网站的目标fifa世界排名最新
  • 有哪些网站用mysql西安分类信息seo公司
  • 网站做视频好不好指数查询