Python面试常考函数
以下是数据处理、分析和可视化领域面试中常考的100个函数,按类别整理:
Pandas库函数(约40个)
- pd.read_csv() - 读取CSV文件
- pd.read_excel() - 读取Excel文件
- pd.DataFrame() - 创建数据框
- pd.Series() - 创建序列
- df.head() - 查看前几行
- df.tail() - 查看后几行
- df.info() - 查看数据信息
- df.describe() - 描述性统计
- df.shape - 查看数据维度
- df.columns - 获取列名
- df.dtypes - 查看数据类型
- df.isnull() - 检查缺失值
- df.fillna() - 填充缺失值
- df.dropna() - 删除缺失值
- df.drop() - 删除行或列
- df.rename() - 重命名列
- df.sort_values() - 按值排序
- df.sort_index() - 按索引排序
- df.groupby() - 分组操作
- df.agg() - 聚合函数
- df.merge() - 合并数据框
- df.join() - 连接数据框
- df.concat() - 拼接数据框
- df.pivot_table() - 创建透视表
- df.melt() - 宽数据转长数据
- df.apply() - 应用函数
- df.applymap() - 元素级应用函数
- df.map() - 序列映射
- df.query() - 查询数据
- df.loc[] - 标签索引
- df.iloc[] - 位置索引
- df.unique() - 唯一值
- df.nunique() - 唯一值数量
- df.value_counts() - 值计数
- df.corr() - 相关性分析
- df.cov() - 协方差分析
- df.sample() - 随机抽样
- df.copy() - 复制数据框
- df.to_csv() - 导出CSV
- df.to_excel() - 导出Excel
NumPy库函数(约20个)
- np.array() - 创建数组
- np.arange() - 创建等差数组
- np.linspace() - 创建线性间隔数组
- np.zeros() - 创建全零数组
- np.ones() - 创建全一数组
- np.random.rand() - 生成随机数
- np.random.randn() - 生成标准正态分布随机数
- np.random.randint() - 生成随机整数
- np.reshape() - 改变数组形状
- np.transpose() - 转置数组
- np.concatenate() - 连接数组
- np.split() - 分割数组
- np.sort() - 排序数组
- np.mean() - 计算平均值
- np.median() - 计算中位数
- np.std() - 计算标准差
- np.var() - 计算方差
- np.sum() - 求和
- np.min() - 最小值
- np.max() - 最大值
Matplotlib库函数(约15个)
- plt.figure() - 创建图形
- plt.plot() - 绘制线图
- plt.scatter() - 绘制散点图
- plt.bar() - 绘制柱状图
- plt.hist() - 绘制直方图
- plt.boxplot() - 绘制箱线图
- plt.pie() - 绘制饼图
- plt.xlabel() - 设置x轴标签
- plt.ylabel() - 设置y轴标签
- plt.title() - 设置标题
- plt.legend() - 添加图例
- plt.grid() - 添加网格
- plt.xlim() - 设置x轴范围
- plt.ylim() - 设置y轴范围
- plt.show() - 显示图形
Seaborn库函数(约15个)
- sns.lineplot() - 绘制线图
- sns.scatterplot() - 绘制散点图
- sns.barplot() - 绘制柱状图
- sns.histplot() - 绘制直方图
- sns.boxplot() - 绘制箱线图
- sns.violinplot() - 绘制小提琴图
- sns.heatmap() - 绘制热力图
- sns.pairplot() - 绘制成对关系图
- sns.jointplot() - 绘制联合分布图
- sns.distplot() - 绘制分布图
- sns.countplot() - 绘制计数图
- sns.regplot() - 绘制回归图
- sns.lmplot() - 绘制线性模型图
- sns.set_style() - 设置样式
- sns.set_palette() - 设置调色板
数据处理与分析函数(约10个)
- pd.to_datetime() - 转换为日期时间
- df.resample() - 时间重采样
- df.rolling() - 滚动窗口计算
- df.expanding() - 扩展窗口计算
- df.shift() - 数据平移
- df.pct_change() - 百分比变化
- df.cumsum() - 累积求和
- df.cumprod() - 累积乘积
- df.rank() - 排名
- df.cut() - 数据分箱
这些函数涵盖了数据处理、分析和可视化的主要方面,建议不仅要掌握它们的基本用法,还要理解它们在实际数据分析场景中的应用。
Python面试中经常考察的函数可以分为几大类,以下是常见的100个函数及其用法:
内置函数(约30个)
print()
- 输出内容len()
- 返回对象长度range()
- 生成数字序列type()
- 返回对象类型str()
- 转换为字符串int()
- 转换为整数float()
- 转换为浮点数list()
- 转换为列表dict()
- 创建字典tuple()
- 创建元组set()
- 创建集合max()
- 返回最大值min()
- 返回最小值sum()
- 求和sorted()
- 排序enumerate()
- 枚举zip()
- 合并迭代器map()
- 映射函数filter()
- 过滤reduce()
- 累积计算isinstance()
- 判断类型hasattr()
- 判断属性getattr()
- 获取属性setattr()
- 设置属性delattr()
- 删除属性open()
- 打开文件input()
- 获取用户输入eval()
- 执行表达式exec()
- 执行代码dir()
- 列出属性
字符串处理函数(约15个)
str.split()
- 分割字符串str.join()
- 连接字符串str.strip()
- 去除两端空白str.replace()
- 替换str.find()
- 查找子串str.index()
- 查找索引str.count()
- 计数str.upper()
- 转大写str.lower()
- 转小写str.capitalize()
- 首字母大写str.title()
- 标题化str.startswith()
- 判断开头str.endswith()
- 判断结尾str.format()
- 格式化str.isdigit()
- 判断数字
列表/元组操作函数(约15个)
list.append()
- 添加元素list.extend()
- 扩展列表list.insert()
- 插入元素list.remove()
- 移除元素list.pop()
- 弹出元素list.sort()
- 排序list.reverse()
- 反转list.count()
- 计数list.index()
- 查找索引tuple.count()
- 计数tuple.index()
- 查找索引list.copy()
- 复制list.clear()
- 清空all()
- 全部为真any()
- 任一为真
字典操作函数(约10个)
dict.keys()
- 获取键dict.values()
- 获取值dict.items()
- 获取键值对dict.get()
- 获取值dict.update()
- 更新字典dict.pop()
- 弹出值dict.popitem()
- 弹出项dict.setdefault()
- 设置默认值dict.clear()
- 清空dict.copy()
- 复制
集合操作函数(约10个)
set.add()
- 添加元素set.update()
- 更新集合set.remove()
- 移除元素set.discard()
- 丢弃元素set.pop()
- 弹出元素set.clear()
- 清空set.union()
- 并集set.intersection()
- 交集set.difference()
- 差集set.symmetric_difference()
- 对称差集
文件操作函数(约10个)
file.read()
- 读取文件file.readline()
- 读取行file.readlines()
- 读取所有行file.write()
- 写入文件file.writelines()
- 写入多行file.close()
- 关闭文件file.seek()
- 移动指针file.tell()
- 获取指针位置file.flush()
- 刷新缓冲区with open()
- 上下文管理器
其他重要函数(约10个)
lambda
- 匿名函数def
- 定义函数return
- 返回值yield
- 生成器import
- 导入模块from...import
- 导入特定函数class
- 定义类__init__()
- 初始化方法__str__()
- 字符串表示__repr__()
- 官方字符串表示
这些函数是Python面试中的高频考点,建议不仅要了解它们的基本用法,还要理解它们的工作原理和适用场景。
以上内容由AI生成,仅供参考和借鉴