当前位置: 首页 > wzjs >正文

晋城建设公司网站郑州制作网站费用

晋城建设公司网站,郑州制作网站费用,wifi如何咨询网络服务商,百度站点提交工具一、二分类问题 逻辑回归的前一部分是线性回归: 一切是在思考假设,通过sigmoid函数把z从0到1: 因为阶跃函数不可导: 所以想方法用sigmoid: 对于g(z),如果e等于0的时候就是0.5,等于负无穷的时候趋于0&…

一、二分类问题

逻辑回归的前一部分是线性回归:

一切是在思考假设,通过sigmoid函数把z从0到1:

因为阶跃函数不可导:

所以想方法用sigmoid:

 

对于g(z),如果e等于0的时候就是0.5,等于负无穷的时候趋于0,等于正无穷的时候趋于1。

现在做假设,现在认为这个值是一件事发生的概率右边就是一分类,左边就是零分类。

然后开始算损失,这里不用均方差算,使用对数损失,也就是二进制交叉熵损失:

cost损失的值越小,那么预测的类别准确度更高 

线性回归之所以可以用于分类:

 代码部分:

"""
逻辑回归做二分类进行癌症预测(根据细胞的属性特征)
:return: NOne
"""
# 构造列标签名字
column = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin', 'Normal Nucleoli','Mitoses', 'Class']# 读取数据
# data = pd.read_csv(
#     "https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",
#     names=column)
data = pd.read_csv("./data/breast-cancer-wisconsin.csv",names=column)
# print(data) #想看可以解除
#当你读取数据时,看上去是数值的列,读进来是字符串,说明里边
# 存在了非数值情况
print(data.info())
print('-'*50)
data.describe(include='all')
# data删除Bare Nuclei列,因为它是object类型,不能直接作为特征
data2 = data.drop(columns=['Bare Nuclei'])
# 进行数据的分割,第零列是编号,不可以作为特征,把第1-9列作为特征,第10列作为标签
x_train, x_test, y_train, y_test = train_test_split(data[column[1:10]], data[column[10]], test_size=0.25,random_state=1)# 进行标准化处理
std = StandardScaler()x_train = std.fit_transform(x_train) #训练集标准化
x_test = std.transform(x_test) #测试集标准化
x_train[0]
#
# # 逻辑回归预测
# C正则化力度,跟学习率有关
# solver = 'liblinear'  solver是学习率优化算法,就是学习率会随着epoch的变化而变化
#epoch就代表第几次迭代
#max_iter 最大迭代次数
lg = LogisticRegression(C=0.5, solver='lbfgs')
#
lg.fit(x_train, y_train)
# 逻辑回归的权重参数,了解,没那么重要
print(lg.coef_)y_predict = lg.predict(x_test)
# print(y_predict) #预测的标签
print("准确率:", lg.score(x_test, y_test))
print(y_test[0:5])
print('-'*50)
print(lg.predict_proba(x_test)[0:5])  #得出对应分类的概率
# 为什么还要看下召回率,labels和target_names对应
# macro avg 平均值  weighted avg 加权平均值
print(classification_report(y_test, y_predict, labels=[2, 4], target_names=["良性", "恶性"]))
#AUC计算要求是二分类,不需要是0和1
print("AUC指标:", roc_auc_score(y_test, y_predict))

二、多分类问题

先把其中两个分类当成一个分类,相当于把原来两个标签值改了,多加一列在原数据里。这样可以训练出第一个逻辑回归模型,然后再训练出第二个逻辑回归模型


文章转载自:

http://EbUokTsx.zmzdx.cn
http://Pfm5kvB0.zmzdx.cn
http://o6UshJWU.zmzdx.cn
http://b43AVeOS.zmzdx.cn
http://kgruxEiF.zmzdx.cn
http://BqbgMfHK.zmzdx.cn
http://3YuNHmCX.zmzdx.cn
http://Y6KFY0IF.zmzdx.cn
http://trZp52zY.zmzdx.cn
http://vinT9dxC.zmzdx.cn
http://92T2fkyf.zmzdx.cn
http://6QAM1f9Q.zmzdx.cn
http://aTYwvrRL.zmzdx.cn
http://NcnTPa9e.zmzdx.cn
http://7C5XVpkP.zmzdx.cn
http://B3CmlfIA.zmzdx.cn
http://rTQAg8Ji.zmzdx.cn
http://zfGRfxRb.zmzdx.cn
http://yPC9gM5C.zmzdx.cn
http://tx1MCtq3.zmzdx.cn
http://2fmtNKkn.zmzdx.cn
http://29r8ATwF.zmzdx.cn
http://qvUqGT1i.zmzdx.cn
http://i5u4By9i.zmzdx.cn
http://5gVRujEi.zmzdx.cn
http://TBIKjO92.zmzdx.cn
http://rWDpThM9.zmzdx.cn
http://nRuLtWrq.zmzdx.cn
http://wZDUuOkv.zmzdx.cn
http://3D51DKlV.zmzdx.cn
http://www.dtcms.com/wzjs/609629.html

相关文章:

  • 互动类网站做短租有哪些网站
  • 墨刀做网站网页做网站得基础
  • dw建设网站步骤二七区网站建设
  • 网站永久免费建站城市维护建设税在哪个网站申报
  • 建设网站需要用到哪些软件专注网站建设16年
  • 建一个网站是不是要开公司全国装修公司前50强
  • 做网站为什么用php深圳专业做网站技术
  • 上海技术网站建设wordpress 怎么改密码
  • 绵阳网站排名网站后台程序如何做
  • 广州网站优化流程成品电影网站建设
  • 古镇企业网站建设河南网页设计公司
  • 香河县住房和城乡建设局网站家具电商网站建设
  • 上海网站搜索排名wordpress 作者id
  • 中国建设银行网站类型分析拖拽网站
  • 怎么注册一个网站做色流大学生网站开发总结报告
  • 企业网站cms源码wordpress大小
  • 网站建设问题表广州天河区网站设计公司
  • 网站建设费计入那个科目网站技术部门架构
  • icp是网站备案福清可以做宣传的网站
  • 成都网站制作费用网站建设这个行业如何
  • 宜黄住房和城乡建设部网站玉树州wap网站建设公司
  • 上海住房城乡建设网站证件查询平面设计图形
  • 淘宝联盟网站建设不完整做任务的电脑网站
  • 成都专业网站建设价格低网站开发找谁
  • 中廉建设网站桂林两江四湖景区导游词
  • 检察门户网站建设自查报告自媒体平台排行榜前十名
  • 哪里有好看的网站阿里巴巴的网站二维码怎么做
  • 公司需要一个简单的网站演讲网站开发背景
  • 2022建站市场pyton 网站开发
  • 如何免费做网站赚钱中国互联网协会会员单位