当前位置: 首页 > news >正文

Python Day8

@浙大疏锦行 PythonDay8.

内容:

  • 字典(字典对)
    • dict_test = dict(name='zhangsan', age=18)
  • 标签编码(离散特征 && 有顺序)
  • 连续特征的归一化和标准化处理

代码:

# Question 1 dic
dict = {'Alice': 100, 'Bob': 200, 'Charlie': 300}# Question 2 label-Code and 连续变量编码
import pandas as pd
import numpy as np# 独热编码
def one_hot(data, columns):data = pd.get_dummies(data=data, columns=columns)return data
# 标签编码
def label_encoder(data, columns):if len(columns)  == 0:  # 处理异常情况return datavalue_index = list(range(len(columns))) # [1 2 3 4 5 6]mapping = dict(zip(columns, value_index))data[columns] = data[columns].map(mapping)return data
# 归一化
def min_max(data, columns):if len(columns)  == 0:  # 处理异常情况return datafor column in columns:column_data = data[column]min_val = column_data.min()max_val = column_data.max()column_data = (column_data - min_val) / (max_val - min_val)data[column] = column_datareturn datadata = pd.read_csv("./data/heart.csv")
discrete_columns = []
continuous_columns = []
for column in data.columns:if data[column].dtype == 'object':discrete_columns.append(column)else:continuous_columns.append(column)data = min_max(data, continuous_columns) # 归一化
# data = one_hot(data, discrete_columns) # 独热编码
data = label_encoder(data, discrete_columns) # 标签编码print(data.head())

http://www.dtcms.com/a/271652.html

相关文章:

  • 第九篇:信息化知识 --系统集成项目管理工程师 第3版专题知识点笔记
  • MySQL--函数
  • [Python 基础课程]关键字
  • 1068.产品销售分析Ⅰ
  • S7-1500——(一)从入门到精通1、基于TIA 博途解析PLC程序结构(三)
  • 2025年ATL宁德新能源Verify测评演绎推理数字计算SHL测评题库高分攻略分享
  • 10.9 大模型训练数据优化实战:3步让准确率从68%飙升至79%
  • Redis-哨兵机制doctor环境搭建
  • 虚拟机安装与使用vim编辑器简单使用
  • # 手机连接Wifi热点时如何设置手机的MAC地址绑定固定的静态IP地址?
  • 客户端与服务端数据加密方案及实现
  • TCP的可靠传输机制
  • Linux系统-----nfs存储,共享配置文件
  • LLM 在预测下一个词的时候是怎么计算向量的,说明详细过程
  • QT6 源(158)模型视图架构里的文件系统模型 QFileSystemModel 篇一:属性,成员函数,与信号函数
  • 练习:对象数组 5
  • 【隐藏谷歌原生Qsb,将Widget中的Qsb组件替换至原位(解决GMS包添加后默认Qsb搜索框无法操作的问题)】
  • QT事件处理机制详解:从原理到实战
  • 深入浅出二分法:从实际问题看“最小化最大值”问题的求解之道
  • 技术支持丨解决 ServBay 在 Windows 启动时反复提示安装 .NET 的问题
  • 数据治理全景能力图谱与路线图:构建企业级数据治理的全貌视角
  • React 19 概览:新特性与生态系统变革
  • 缺乏项目进度数据沉淀,如何做好进度复盘
  • linux-用户和组
  • GIS使用方法详解
  • 在线生成树形目录文本
  • uniapp真机调试“没有检测到设备,请插入设备或启动模拟器后点击刷新再试”
  • TCP/IP常用协议
  • sftGRPO
  • 链表算法之【删除链表的倒数第n个节点】