当前位置：首页 > wzjs >正文

制作一个静态网页建站合肥网络公司seo

wzjs 2025/7/28 18:39:48

制作一个静态网页,建站合肥网络公司seo,微信公众号怎么做商城,做调查赚钱网站锋哥原创的Pandas2 Python数据处理与分析视频教程： 2025版 Pandas2 Python数据处理与分析视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili Pandas将数据加载到DataFrame后，就可以使用DataFrame对象的属性和方法进行操作。这些操作有的是完成数据…

锋哥原创的Pandas2 Python数据处理与分析视频教程：

2025版 Pandas2 Python数据处理与分析视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili

Pandas将数据加载到DataFrame后，就可以使用DataFrame对象的属性和方法进行操作。这些操作有的是完成数据分析中的常规统计工作，有的是对数据的加工处理。无论是在分析统计方面还是在加工处理方面，Pandas都提供了丰富且实用的功能。

Pandas可以将指定格式(CSV,Excel,SQL等)的数据读取到DataFrame中，并将DataFrame输出为指定格式(CSV,Excel,SQL等)的文件。

Pandas 是一个强大的 Python 库，用于数据处理和分析。它提供了许多函数来读取和导入数据，支持多种文件格式，如 CSV、Excel、SQL 数据库、JSON 等。以下是一些常用的数据读取和导出方法：

格式	文件格式	读取函数	写入（导出）函数
binary	Excel	read_excel	to_excel
text	CSV	read_csv	to_csv
text	JSON	read_json	to_json
text	网页表格	HTML	to_html
text	剪切板	read_clipboard	to_clipboard
SQL	SQL	read_sql	to_sql

其中：

读取函数一般会赋值给一个变量 df, df = pd.read_()

输出函数是将变量自身进行操作并输出 df.to()

常用函数方法 Excel 对象 ~ pd.ExcelFile 对象 ~ pd.ExcelWriter 对象 ~ pd.ExcelWriter 对象的属性和方法读取数据 ~ pd.read_csv() ~ pd.read_excel() ~ pd.json_normalize() ~ pd.read_pickle() ~ pd.read_table() ~ pd.DataFrame.from_dict() 从字典创建 DataFrame ~ pd.read_clipboard() 从剪贴板读取数据 ~ pd.read_json() 读取 JSON ~ pd.read_sql() 读取数据库数据 ~ pd.read_fwf() 读取固定宽度格式文件 ~ pd.read_html() 从 HTML 文档提取表格数据 ~ pd.read_parquet() 读取 Parquet 文件导出数据 ~ to_csv() 导出为 CSV文件 ~ to_excel() 导出为 Excel 文件 ~ to_dict() 输出字典 ~ to_pickle() 序列化为 pickle 文件 ~ to_json() 转换为 JSON 格式字符串 ~ to_html() 转换为 HTML 表格格式 ~ to_sql() 写入到关系型数据库 ~ to_parquet() 保存为 parquet 文件

1.读取CSV文件

CSV（Comma-Separated Values）是用逗号分隔值的数据形式，有时也称为字符分隔值，因为分隔字符也可以不是逗号。CSV文件的一般文件扩展名为.csv，用制表符号分隔也常用.tsv作为扩展名。CSV不仅可以是一个实体文件，还可以是字符形式，以便于在网络上传输。

CSV不带数据样式，标准化较强，是最为常见的数据格式。

下面student_scores.csv可以看下格式。

参考代码：

import pandas as pd

df = pd.read_csv('student_scores.csv')

2.读取Excel文件

参考代码：

import pandas as pd

df = pd.read_excel('student_scores.xlsx')  # 默认读取第一个标签页Sheet
df = pd.read_excel('student_scores2.xlsx', sheet_name="Sheet2")  # 指定标签Sheet页

3.从SQL数据库读取

Pandas需要引入SQLAlchemy库来支持SQL，在SQLAlchemy的支持下，它可以实现所有常见数据库类型的查询、更新等操作。

首先第一步要安装pymysql，作为连接mysql的驱动，pip安装命令：

pip install pymysql -i https://mirrors.aliyun.com/pypi/simple

然后再安装下sqlalchemy库：pip安装命令

pip install flask-sqlalchemy -i https://mirrors.aliyun.com/pypi/simple

安装后，Python Interpreter里面里面可以看到

参考代码：

import pandas as pd

from sqlalchemy import create_engine

# 创建数据库引擎
# 注意：替换下面的用户名、密码、主机名和数据库名
engine = create_engine('mysql+pymysql://root:123456@localhost:3308/db_xuanke')

# 使用SQLAlchemy引擎读取数据到DataFrame
query = "SELECT * FROM rc_admin"
df = pd.read_sql_query(query, con=engine)
print(df)

运行结果：

   admin_id admin_username admin_password  admin_privilege
0         1          admin         123456              255
1         2        jwadmin         123456               96

4.读取JSON文件

JSON是互联网上非常通用的轻量级数据交换格式，是HTTP请求中数据的标准格式之一。Pandas提供的JSON读取方法在解析网络爬虫数据时，可以极大地提高效率。

json文件示例：

[{"name": "Alice","age": 25,"city": "New York"},{"name": "Bob","age": 30,"city": "Los Angeles"},{"name": "Charlie","age": 35,"city": "Chicago"}
]

参考代码：

import pandas as pd

df = pd.read_json('file.json')
print(df)

运行输出：

      name  age         city
0    Alice   25     New York
1      Bob   30  Los Angeles
2  Charlie   35      Chicago

5.读取HTML表格

pd.read_html()函数可以接受HTML字符串、HTML文件、URL，并将HTML中的<table>标签表格数据解析为DataFrame。如返回有多个df的列表，则可以通过索引取第几个。如果页面里只有一个表格，那么这个列表就只有一个DataFrame。

操作html，必须要安装lxml库：

pip install lxml -i https://mirrors.aliyun.com/pypi/simple

html表格文件示例：

<!DOCTYPE html>
<html lang="en">

<head><meta charset="UTF-8"><title>Example Table</title>
</head>

<body>
<table><thead><tr><th>Name</th><th>Age</th><th>City</th></tr></thead><tbody><tr><td>Alice</td><td>25</td><td>New York</td></tr><tr><td>Bob</td><td>30</td><td>Los Angeles</td></tr><tr><td>Charlie</td><td>35</td><td>Chicago</td></tr></tbody>
</table>
</body>

</html>

参考代码：

import pandas as pd

try:# 读取 HTML 文件dfs = pd.read_html('example.html')
# 打印每个表格的基本信息和内容for i, df in enumerate(dfs):print(f"第 {i + 1} 个表格基本信息：")df.info()
rows, columns = df.shape
if rows < 10:print(f"第 {i + 1} 个表格全部内容信息：")print(df.to_csv(sep='\t', na_rep='nan'))else:print(f"第 {i + 1} 个表格前几行内容信息：")print(df.head().to_csv(sep='\t', na_rep='nan'))

except FileNotFoundError:print("错误: 文件未找到，请检查文件路径。")
except ValueError:print("错误: 文件中未找到有效的表格。")
except Exception as e:print(f"错误: 发生了未知错误: {e}")

运行输出：

第 1 个表格基本信息：
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):#   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 0   Name    3 non-null      object1   Age     3 non-null      int64 2   City    3 non-null      object
dtypes: int64(1), object(2)
memory usage: 204.0+ bytes
第 1 个表格全部内容信息：Name    Age City
0   Alice   25  New York
1   Bob 30  Los Angeles
2   Charlie 35  Chicago

6.从剪切板读取

剪贴板（Clipboard）是操作系统级的一个暂存数据的地方，它保存在内存中，可以在不同软件之间传递，非常方便。Pandas支持读取剪贴板中的结构化数据，这就意味着我们不用将数据保存成文件，而可以直接从网页、Excel等文件中复制，然后从操作系统的剪贴板中读取，非常方便。

复制下内容到剪切板：

  姓名 年龄 城市
1 小明 25  北京
2 小红 30  上海
3 小邓 35  广州

示例代码：

import pandas as pd

df = pd.read_clipboard()
print(df)

运行结果：

查看全文

http://www.dtcms.com/wzjs/129370.html

企业vis是指什么抖音seo优化公司

30日长春疫情信息流优化师面试常见问题

美术馆网站的建设流程百度竞价怎么做

网站做等报定级工作要多久个人如何做seo推广

修改wordpress pages重庆网页优化seo公司

合肥情况通报重庆seo技术分享

中国建设银行招标网站托管竞价账户哪家好

做游戏开箱网站的法律风险郑州网络推广平台

装饰公司做网站宣传的是个好处怎么给公司做网站推广

日照企业网站建设公司网页制作软件

鞋子商城网站开发背景百度退款客服电话

创意设计pptseo网站优化师

怎么做网站里面的模块谷歌网页版入口

网站维护与建设内容油烟机seo关键词

网站建设双十一百度推广登录平台网址

上海微网站开发卖友情链接的哪来那么多网站

怎么攻击phpweb网站网络推广方法大全

深圳网站开发平台百度云搜索

昆明做网站建设价位网络推广外包想手机蛙软件

易语言做返利网站seo关键词优化软件合作

谷歌seo难吗seo01

互联网网站建设公司上海培训机构白名单

python 网站开发 linuxseo是谁

广州品牌网站建设优美优化大师官网登录入口

网站建设原网络营销产品的首选产品

设计方案网站百度号码认证平台

西安市住房和城乡建设局网站网络暴力事件

网站建设理念网站软文代写

做株洲网站需要多少钱互联网推广方案怎么写

初创公司网站设计苏州外链网站推荐

1.读取CSV文件

2.读取Excel文件

3.从SQL数据库读取

4.读取JSON文件

5.读取HTML表格

6.从剪切板读取

相关文章：