当前位置: 首页 > news >正文

机器学习-逻辑回归与二分类

9.逻辑回归

(1)应用场景

广告点击率   是否会被点击

是否为垃圾邮件

是否患病

是否为金融诈骗

是否为虚假账号

(2)逻辑回归的原理

1.输入

逻辑回归的输入就是一个线性回归的结果

2.激活函数

sigmold函数  [0,1]

1/(1+e^(-x))

假设函数/线性模型

1/(1+e^(-(w1x1+w2x2+w3x3+...+wnxn+b)))

损失函数

(y_predict - y_true)平方和/总数

    逻辑回归的真实值/预测值 是否属于某个类别

    对数似然损失

y=1 真实值属于这个类别       y=0 真实值不属于这个类别

计算损失:其中x为逻辑回归结果,y为真实结果

log(P),P值越大,结果越小

优化损失

         梯度下降

(3)逻辑回归API

 

 案例:癌症分类预测-良/恶性乳腺癌预测

流程分析:

import pandas as pd
import numpy as np

1)获取数据

        读取的时候加上names

#1.读取数据
path = "网址"
column_name = [数据列名称]
data = pd.read_csv(patn,names=column_name)

2)数据处理

        处理缺失值

#2.缺失值处理
# 1)替换-)np.nan
data = data.replace(to_replace="7",value=np.nan)
# 2)删除缺失样本
data.dropna(inplace=True)

3)数据集划分

# 3.划分数据集
from sklearn.model_selection import train_test_split# 筛选特征值和目标值
x = data.iloc[:,1:-1]
y = data["Class"]
x_train,x_test,y_train,y_test = train_test_aplit(x,y)

4)特征工程:

        无量纲化处理-标准化

#4.标准化
from sklearn.preprocessing import StandardScaler

5)逻辑回归预估器

from sklearn.linear_model import LogisticRegression
eatimator = LogisticRegression()
estimator.fit(x_train,y_train)
#逻辑回归的模型参数:回归系数和偏执
estimator.coef_estimator.intercept_

  6)模型评估

# 模型评估
# 方法1:直接比对真实值和预测值
y_predict = estimator.predict(x_test)
print("y_predict:\n",y_predict)
print("直接比对真实值和预测值:\n",y_test = y_predict)#方法2:计算准确率
score = estimator.score(x_test,y_test)
print("准确率为:\n",score)

10.分类的评估方法

(1)精确率与召回率

  1 混淆矩阵

        TP = True Possitive

        FN = False Negative

2 精确率(Precision)与召回率(Recall)

精确率:预测结果为正例样本中真实为正例的比例

召回率:真实为正例的样本中预测结果为正例的比例     查的全不全

F1-score   模型的稳健性    

# 查看精确率,召回率,F1-score
from sklearn.metrics import classification_report
report = classification_report(y_test,y_predict,label=[2,4],target_names=["良性","恶性")

http://www.dtcms.com/a/581345.html

相关文章:

  • 老玩家流失?基于数据驱动的游戏用户流失分析与干预策略
  • 做网站的公司名字北京注册网站
  • 如何用c 做网站hao123从网上开始
  • ThinkPHP 8 多应用模式下如何隐藏路由中的应用名
  • [SEO]网站不收录的原因及解决方法有哪些
  • conda以及Jupyter notebook的使用
  • 告别手动录入:文档抽取技术如何让RPA处理非结构化数据?
  • MIT-数字棋盘和数字三角形
  • 自助网站建设费用怎样做软件开发
  • Python面向对象和方法
  • AJAX 实例详解
  • 检测图片URL是否失效
  • 网站设计专业实验室建设与wordpress集成软件
  • 15、RabbitMQ
  • ftp怎么连接网站空间高端网站制造
  • 命名空间的内联与嵌套
  • UML建模工具Enterprise Architect如何建立和执行架构标准和规范
  • 项目一:意图识别技术与实战(案例:智能政务热线意图分类与工单自动分发系统)
  • Spec-Kit 实战指南:从零到一构建“照片拖拽相册”Web App
  • 一个网站怎么做多条线路郑州市城乡建设局证书查询
  • 河南平台网站建设价位织梦商业网站内容管理系统
  • 圆桌论坛精华实录 | AI是重构运维逻辑的颠覆性革命?博睿数据与行业大咖亲授“AI+可观测性”的破局之道
  • 高并发场景下的缓存利器
  • XML 元素:解析与运用
  • LegionSpace黑客松指南(二):MCP服务开发与集成详解
  • 关于js导入Excel时,Excel的(年/月/日)日期是五位数字的问题。以及对Excel日期存在的错误的分析和处理。
  • 内网穿透的应用-摆脱局域网!Stable Diffusion3.5 结合cpolar使用更方便
  • postgresql客户端升级
  • 16openlayers加载COG(云优化Geotiff)
  • 万网做的网站咋样wordpress 用户api