当前位置：首页 > news >正文

机器学习-逻辑回归与二分类

news 2025/11/8 8:12:38

9.逻辑回归

（1）应用场景

广告点击率是否会被点击

是否为垃圾邮件

是否患病

是否为金融诈骗

是否为虚假账号

（2）逻辑回归的原理

1.输入

逻辑回归的输入就是一个线性回归的结果

2.激活函数

sigmold函数 [0,1]

1/(1+e^(-x))

假设函数/线性模型

1/（1+e^(-(w1x1+w2x2+w3x3+...+wnxn+b)))

损失函数

（y_predict - y_true)平方和/总数

逻辑回归的真实值/预测值是否属于某个类别

对数似然损失

y=1 真实值属于这个类别 y=0 真实值不属于这个类别

计算损失：其中x为逻辑回归结果，y为真实结果

log(P),P值越大，结果越小

优化损失

梯度下降

（3）逻辑回归API

案例：癌症分类预测-良/恶性乳腺癌预测

流程分析：

import pandas as pd
import numpy as np

1）获取数据

读取的时候加上names

#1.读取数据
path = "网址"
column_name = [数据列名称]
data = pd.read_csv(patn,names=column_name)

2)数据处理

处理缺失值

#2.缺失值处理
# 1）替换-）np.nan
data = data.replace(to_replace="7",value=np.nan)
# 2)删除缺失样本
data.dropna(inplace=True)

3）数据集划分

# 3.划分数据集
from sklearn.model_selection import train_test_split# 筛选特征值和目标值
x = data.iloc[:,1:-1]
y = data["Class"]

x_train,x_test,y_train,y_test = train_test_aplit(x,y)

4）特征工程：

无量纲化处理-标准化

#4.标准化
from sklearn.preprocessing import StandardScaler

5）逻辑回归预估器

from sklearn.linear_model import LogisticRegression

eatimator = LogisticRegression()
estimator.fit(x_train,y_train)

#逻辑回归的模型参数：回归系数和偏执
estimator.coef_estimator.intercept_

6）模型评估

# 模型评估
# 方法1：直接比对真实值和预测值
y_predict = estimator.predict(x_test)
print("y_predict:\n",y_predict)
print("直接比对真实值和预测值:\n",y_test = y_predict)#方法2：计算准确率
score = estimator.score(x_test,y_test)
print("准确率为：\n",score)

10.分类的评估方法

（1）精确率与召回率

1 混淆矩阵

TP = True Possitive

FN = False Negative

2 精确率（Precision)与召回率（Recall)

精确率：预测结果为正例样本中真实为正例的比例

召回率：真实为正例的样本中预测结果为正例的比例查的全不全

F1-score 模型的稳健性

# 查看精确率，召回率，F1-score
from sklearn.metrics import classification_report

report = classification_report(y_test,y_predict,label=[2,4],target_names=["良性","恶性")

查看全文

http://www.dtcms.com/a/581345.html

老玩家流失？基于数据驱动的游戏用户流失分析与干预策略

做网站的公司名字北京注册网站

如何用c 做网站hao123从网上开始

ThinkPHP 8 多应用模式下如何隐藏路由中的应用名

[SEO]网站不收录的原因及解决方法有哪些

conda以及Jupyter notebook的使用

告别手动录入：文档抽取技术如何让RPA处理非结构化数据？

MIT-数字棋盘和数字三角形

自助网站建设费用怎样做软件开发

Python面向对象和方法

AJAX 实例详解

检测图片URL是否失效

网站设计专业实验室建设与wordpress集成软件

15、RabbitMQ

ftp怎么连接网站空间高端网站制造

命名空间的内联与嵌套

UML建模工具Enterprise Architect如何建立和执行架构标准和规范

项目一：意图识别技术与实战（案例：智能政务热线意图分类与工单自动分发系统）

Spec-Kit 实战指南：从零到一构建“照片拖拽相册”Web App

一个网站怎么做多条线路郑州市城乡建设局证书查询

河南平台网站建设价位织梦商业网站内容管理系统

圆桌论坛精华实录 | AI是重构运维逻辑的颠覆性革命？博睿数据与行业大咖亲授“AI+可观测性”的破局之道

高并发场景下的缓存利器

XML 元素：解析与运用

LegionSpace黑客松指南（二）：MCP服务开发与集成详解

关于js导入Excel时，Excel的(年/月/日)日期是五位数字的问题。以及对Excel日期存在的错误的分析和处理。

内网穿透的应用-摆脱局域网！Stable Diffusion3.5 结合cpolar使用更方便

postgresql客户端升级

16openlayers加载COG（云优化Geotiff）

万网做的网站咋样wordpress 用户api

9.逻辑回归

10.分类的评估方法

相关文章：