当前位置: 首页 > wzjs >正文

宁化网站建设linux wordpress 权限

宁化网站建设,linux wordpress 权限,什么都可以看的浏览器,广州地铁集团有限公司1. 安装库 pip install requests pip install pandas pip install BeautifulSouprequests 是一个非常流行的 Python 第三方库,用于简化 HTTP 请求。它允许你发送 HTTP/1.1 请求极其简单,而无需底层的socket库或urllib库。requests 库使得发起请求、处理…

1. 安装库

pip install requests
pip install pandas
pip install BeautifulSoup
  • requests 是一个非常流行的 Python 第三方库,用于简化 HTTP 请求。它允许你发送 HTTP/1.1 请求极其简单,而无需底层的socket库或urllib库。requests 库使得发起请求、处理响应变得非常容易,并且支持多种类型的HTTP请求(GET, POST, PUT, DELETE等)。

  • pandas主要用于数据分析和数据处理。它提供了大量的数据结构和数据操作功能,使得处理表格数据变得更加容易和高效。是目前比较常用的一款Python包。

  • BeautifulSoup4(通常简称 BeautifulSoup)是一个用于解析HTML和XML文档的Python库。它可以帮助开发者从网页中提取所需的数据,常用于Web爬虫项目、数据挖掘以及其他需要解析HTML或XML文档的场景。

2. 示例代码

# -*- coding: utf-8 -*-
import csv
import requests
import pandas as pd
from bs4 import BeautifulSoup# 目标URL
url = 'https://www.shanghairanking.cn/rankings/bcur/2024'
# 请求头,模拟浏览器行为,防止被服务器识别为爬虫。
headers = {'Connection': 'keep-alive','Cache-Control': 'no-store, no-cache, must-revalidate','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36','Accept': '*/*','Accept-Encoding': 'gzip, deflate, br, zstd','Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8','Referer': 'https://www.shanghairanking.cn/rankings/bcur/2024',
}
# 创建一个会话对象,保持连接
session = requests.session()# 先访问一次首页,模拟用户行为
session.get('https://www.shanghairanking.cn')# 发送带有headers的GET请求并获取响应内容
resHtml = session.get(url, headers=headers).content.decode('utf-8')# 使用BeautifulSoup解析HTML内容
html_soup = BeautifulSoup(resHtml, 'html.parser')# 查找表格中的所有行
all_goods_li = html_soup.find('table').find_all('tr')def export_rank_csv():# 打开CSV文件准备写入with open('output.csv', 'wb') as csvfile:# 创建一个csv.writer对象csv_writer = csv.writer(csvfile)for row in all_goods_li:goods_info_list = []rank = row.find('div', class_="ranking")img_link = row.find('img')['src']name = row.find('span', class_='name-cn')tags = row.find('p', class_="tags")if name and img_link:goods_info_list.append(rank.get_text(strip=True).encode('utf-8'))goods_info_list.append(img_link)# 将name添加到列表中,并转换为UTF-8编码goods_info_list.append(name.get_text(strip=True).encode('utf-8'))goods_info_list.append(tags.get_text(strip=True).encode('utf-8'))csv_writer.writerow(goods_info_list)def export_rank_excel():school_info_list = []for row in all_school_li:rank = row.find('div', class_="ranking")img_link = row.find('img')['src']name = row.find('span', class_='name-cn')tags = row.find('p', class_="tags")if name and img_link:school_info_list.append([rank.get_text(strip=True).encode('utf-8'),img_link,name.get_text(strip=True).encode('utf-8'),tags.get_text(strip=True).encode('utf-8')])# 列名first_name = ["排名", "logo", "学校名称", "类型"]# 创建一个 DataFrame,列名为 first_name,数据为 school_info_listrank = pd.DataFrame(school_info_list, columns=first_name)# 将“排名”列转换为整数类型rank["排名"] = rank["排名"].astype(int)# 使用 openpyxl 作为写入引擎,将 DataFrame 写入 Excel 文件# 注意:这里使用了默认的 UTF-8 编码,通常不需要显式指定编码rank.to_excel(u"2024中国大学排名.xlsx", index=False)if __name__ == '__main__':# 导出csv文件export_rank_csv()

3. 注意事项

  • 编码问题:确保使用正确的编码处理非ASCII字符。
  • 虽然在 Python 2 中 encode(‘utf-8’) 有助于处理编码问题,但在将数据写入 Excel 文件时通常不需要显式指定编码。但是如果导出文件为乱码,在文件开头添加 # -*- coding: utf-8 -*- 以确保文件以 UTF-8 编码保存。
  • 依赖库:确保已经安装了 pandas 和 beautifulsoup4 库。
  • 创建 DataFrame:使用 pandas 创建 DataFrame,列名为 first_name,数据为 school_info_list。
  • 转换数据类型:将“排名”列的数据类型转换为整数。
  • 导出到 Excel 文件:使用 to_excel 方法将 DataFrame 导出到 Excel 文件,index=False 表示不导出索引列。

文章转载自:

http://Xrn6obco.ywxLn.cn
http://NsB7Db75.ywxLn.cn
http://i53tnWYM.ywxLn.cn
http://nUCyFBB5.ywxLn.cn
http://THPiTTD0.ywxLn.cn
http://zFohhDth.ywxLn.cn
http://bab8WRcT.ywxLn.cn
http://0BKefQ8Q.ywxLn.cn
http://L4XEw2Sh.ywxLn.cn
http://heFpOI5L.ywxLn.cn
http://BkFu0Vt8.ywxLn.cn
http://z8yyCdqC.ywxLn.cn
http://UHT8XI0L.ywxLn.cn
http://cqzoRLGh.ywxLn.cn
http://sU01Sugr.ywxLn.cn
http://9vJkyQPI.ywxLn.cn
http://Z1363Uhs.ywxLn.cn
http://Qeo78FRb.ywxLn.cn
http://KafpLyVp.ywxLn.cn
http://uOE3hfoU.ywxLn.cn
http://zjdroVob.ywxLn.cn
http://q9vbHZZp.ywxLn.cn
http://Zd0LGTMZ.ywxLn.cn
http://uVfdOk0Z.ywxLn.cn
http://xeILvgYX.ywxLn.cn
http://gG9lns9z.ywxLn.cn
http://IuuR9eNO.ywxLn.cn
http://5S6K42WE.ywxLn.cn
http://ONW4GlnC.ywxLn.cn
http://rsXEx7uQ.ywxLn.cn
http://www.dtcms.com/wzjs/769960.html

相关文章:

  • 自己建网站做网店网站模板上传
  • 五华建设银行网站中国建设银行手机银行app下载官网
  • 零一云主机一个网站的seo优化有哪些
  • 爱网站黄页海淀网站建设怎么样
  • 市南区网站建设软件服务外包人才培养专业
  • 金华专业的网站建设企业网站建设方案新闻
  • 能赚钱的网站怎么做网站的建设ppt模板
  • 龙岗网站建设代理商网站模板打包
  • 哈尔滨网站建设云聚达那些网站可以做反链
  • 常州网站开发培训猎头公司怎么找
  • 网站到期续费通知中山网站建设价格
  • 四川省四川省住房和城乡建设厅网站互联网推广是什么工作内容
  • 网站死链检测工具免费开源cms内容管理系统
  • 钓鱼网站到底怎么做西安外贸网站建设公司
  • php 网站建设流程可以先做网站后备案么
  • dedecms做的系统_网站主页是哪一个文件微网站开发方案
  • 洛阳响应式建站设计高端网站
  • 苏州高端网站制作怎样做公司的网站
  • 企业网站首页的实现淮安新港建设有限公司网站
  • 北大荒建设集团网站七牛云最新消息
  • 深圳专业建站公司重庆百度推广seo
  • 石家庄建设局网站建设工程合同法规
  • 做传销网站违法移动端包括哪些
  • 南昌企业建站系统模板上高县建设局网站
  • 网站建设和网站优化哪个更重要公司注册资金实缴流程
  • 怎么用pf做网站辽宁建设工程信息网直接发包工程
  • 怎么制作网站上传创建个人网站英文
  • 国外物流公司网站模板公司网页维护
  • 电商网站开发背景游民星空是谁做的网站
  • 青县做网站价格wordpress 3.9 wpmu