当前位置: 首页 > news >正文

pandas读取数据

pandas读取数据

  • 导入需要的包

    import pandas as pd
    import numpy as np
    import warnings
    import os
    
    warnings.filterwarnings('ignore')
    

读取纯文本文件

pd.read_csv

  • 使用默认的标题行、逗号分隔符

    import pandas as pd
    fpath = "./datas/ml-latest-small/ratings.csv"
    '''使用pd.read_csv读取数据'''
    ratings = pd.read_csv(fpath)
    ''' 查看前几行数据'''
    ratings.head()
    

    202107138x45EM

    查看数据的形状

    '''查看数据的形状,返回(行数、列数)'''
    ratings.shape
    (100836, 4)
    
    """输出如下"""
    Index(['userId', 'movieId', 'rating', 'timestamp'], dtype='object')
    

    查看索引列

    '''查看索引列'''
    ratings.index
    
    """输出如下"""
    RangeIndex(start=0, stop=100836, step=1)
    

    查看每列的数据类型

    '''查看每列的数据类型'''
    ratings.dtypes
    
    """输出如下"""
    userId         int64
    movieId        int64
    rating       float64
    timestamp      int64
    dtype: object
    

读取txt文件

  • 自己指定分隔符、列名

    fpath = "./datas/crazyant/access_pvuv.txt"
    
    pvuv = pd.read_csv(
        fpath,
        sep="\t", # 指定分隔符
        header=None, # 告诉pandas该数据没有 特征名称(列名)
        names=['pdate', 'pv', 'uv']  # 自己指定特征名称(列名)
    )
    
    pvuv
    

20210713UknxfN


读取excel文件

  • read_excel

    fpath = "./datas/crazyant/access_pvuv.xlsx"
    pvuv = pd.read_excel(fpath)
    
    pvuv
    

20210713UknxfN


读取MySQL数据库

  • pymysql

    import pymysql
    conn = pymysql.connect(
            host='127.0.0.1',
            user='root',
            password='123qwe',
            database='test',
            charset='utf8'
        )
        
    mysql_page = pd.read_sql("select * from crazyant_pvuv", con=conn)
    mysql_page
    

20210713UknxfN


相关文章:

  • 高并发微服务日志管理:ELK、Loki、Fluentd 终极对决与实战指南
  • 矩阵的 正定(Positive Definite)与负定(Negative Definite):从Fisher信息矩阵看“曲率”的秘密
  • Java所有运算符理解
  • SOME/IP-SD -- 协议英文原文讲解5
  • 线代[8]|北大丘维声教授《怎样学习线性代数?》(红色字体为博主本人注释)
  • Chrome 浏览器(版本号49之后)‌解决跨域问题
  • Hi3516CV610开发板ISP调试之——图像ISP在线调试 环境搭建教程
  • 《白帽子讲Web安全》学习:深入解析Cookie与会话安全
  • 银河麒麟高级服务器操作系统在线调整/pro/{PID}/limits文件中nofile的软限制和硬限制参数值操作方法
  • 设计模式-结构性模式
  • QARepVGG--含demo实现
  • 手写系列——MoE网络
  • 【算法系列】归并排序详解
  • Spring Boot集成RocketMQ:真实项目应用场景
  • VMware虚拟机安装win10系统详细图文安装教程(附安装包) 2025最新版详细图文安装教程
  • C++day6
  • 【MyBatis】带你快速掌握 —— CRUD
  • deepseek 学习资料整理
  • 直击高频编程考点:聚焦新版综合编程能力考查汇总
  • 【nginx】:给nginx增加 password 配置通过简单的方式限制登陆。使用openssl 生成密码
  • 知名中医讲师邵学军逝世,终年51岁
  • 著名文博专家吴远明因交通事故离世,享年75岁
  • 陕西省市监局通报5批次不合格食品,涉添加剂超标、微生物污染等问题
  • 上海黄浦江挡潮闸工程建设指挥部成立,组成人员名单公布
  • 刘晓庆被实名举报涉嫌偷税漏税,税务部门启动调查
  • 新任国防部新闻发言人蒋斌正式亮相