当前位置: 首页 > wzjs >正文

湛江手机网站建设公司企业网站制作流程图

湛江手机网站建设公司,企业网站制作流程图,网站站外优化,怎么做视频平台网站一、引言 心脏病是威胁人类健康的重要疾病之一,早期预测和诊断对防治心脏病具有重要意义。本文利用公开的心脏病数据集,通过机器学习算法构建预测模型,并使用 SHAP 值进行模型可解释性分析,旨在为心脏病的辅助诊断提供参考。 二、…

一、引言

  心脏病是威胁人类健康的重要疾病之一,早期预测和诊断对防治心脏病具有重要意义。本文利用公开的心脏病数据集,通过机器学习算法构建预测模型,并使用 SHAP 值进行模型可解释性分析,旨在为心脏病的辅助诊断提供参考。

 

二、数据准备与预处理

1. 数据加载

  数据集来源于 Kaggle 公开的心脏病数据集(heart.csv),包含 303 条样本和 14 个特征,目标变量为是否患有心脏病(target,0 表示无,1 表示有)。关键代码如下:

data = pd.read_csv('heart.csv')
print(f"数据规模: {data.shape}")  # 输出:数据规模: (303, 14)
print("目标分布:\n", data['target'].value_counts(normalize=True))

  目标分布显示正负样本比例约为 6:4,存在轻微不平衡,后续通过分层抽样处理。 

2. 特征划分

数值型特征:年龄、血压、胆固醇等连续变量,共 6 个。

分类型特征:性别、胸痛类型、血糖等离散变量,共 8 个。

cat_features = ['sex', 'cp', 'fbs', 'restecg', 'exang', 'slope', 'ca', 'thal']
num_features = [c for c in X.columns if c not in cat_features]

 

3. 预处理流程 

采用 ColumnTransformer 构建预处理管道:

数值型特征:标准化(StandardScaler)

分类型特征:独热编码(OneHotEncoder,丢弃第一个类别避免多重共线性)

preprocessor = ColumnTransformer([('num', StandardScaler(), num_features),('cat', OneHotEncoder(drop='first', handle_unknown='ignore'), cat_features)
])

 

 

三、模型训练与对比 

1. 算法选择与超参数调优

选取 4 种经典分类算法,使用 GridSearchCV 进行 5 折交叉验证,以 F1 分数为优化指标:

随机森林(RF):调优参数包括树的数量(n_estimators)和最大深度(max_depth)

逻辑回归(LR):调优参数为正则化系数(C)

决策树(DT):调优参数为最大深度(max_depth)

支持向量机(SVM):调优参数为正则化系数(C)和核函数(kernel)

2. 训练流程

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y  # 分层抽样保持样本分布
)for name, cfg in model_configs.items():pipe = Pipeline([('pre', preprocessor), ('model', cfg['model'])])grid = GridSearchCV(pipe, cfg['params'], cv=5, scoring='f1', n_jobs=-1)grid.fit(X_train, y_train)  # 训练模型# 计算评估指标

 

3. 模型性能对比 

模型

最佳参数

准确率

精确率

召回率

F1 分数

ROC-AUC

rf

{'model__max_depth': 10, 'model__n_estimators': 200}

0.87

0.88

0.85

0.86

0.93

lr

{'model__C': 1.0}

0.85

0.85

0.83

0.84

0.91

dt

{'model__max_depth': 10}

0.83

0.83

0.82

0.82

0.89

svm

{'model__C': 1, 'model__kernel': 'rbf'}

0.86

0.87

0.83

0.85

0.92

结论:随机森林(RF)在 F1 分数和 ROC-AUC 指标上表现最优,选为最终模型。 

 

 

四、模型可解释性分析(SHAP 值) 

1. SHAP 原理简介

  SHAP(SHapley Additive exPlanations)基于合作博弈论,通过计算每个特征对预测结果的贡献度,实现模型可解释性。

2. 特征重要性分析

 (1)条形图

 

(2)摘要图(Beeswarm) 

 

 

五、结论与展望 

 

1. 结论

  随机森林模型在心脏病预测中表现最佳,准确率达 87%,F1 分数 0.86。关键影响因素为冠状动脉钙化数量、地中海贫血筛查结果和运动后 ST 段变化,与医学常识一致,验证了模型的合理性。

 

2. 改进方向

  尝试集成学习(如 Stacking)或深度学习模型(如神经网络)。引入更多临床特征(如家族病史、生活习惯等)提升模型泛化能力。针对不平衡数据采用 SMOTE 等过采样技术优化。


文章转载自:

http://YqZ201DT.Lrnfn.cn
http://mV2NJt2J.Lrnfn.cn
http://Gl7ahFW8.Lrnfn.cn
http://tWF6k96o.Lrnfn.cn
http://laUsaOSg.Lrnfn.cn
http://0tKgHzaG.Lrnfn.cn
http://eX3C1CIf.Lrnfn.cn
http://kyY075Jv.Lrnfn.cn
http://fmtscmFy.Lrnfn.cn
http://uJqhshvj.Lrnfn.cn
http://YFKB9097.Lrnfn.cn
http://uHXdVnJ7.Lrnfn.cn
http://xaJxjc63.Lrnfn.cn
http://Ow30nZqu.Lrnfn.cn
http://sqeCbGqS.Lrnfn.cn
http://D1GxiA5Y.Lrnfn.cn
http://Viak9DLI.Lrnfn.cn
http://gxweijrs.Lrnfn.cn
http://5yRQjFX9.Lrnfn.cn
http://d50dUD6v.Lrnfn.cn
http://kkOQvpWa.Lrnfn.cn
http://xmiTcgu2.Lrnfn.cn
http://E3XvgB4y.Lrnfn.cn
http://VzGIljVD.Lrnfn.cn
http://iRgAVlev.Lrnfn.cn
http://oSgaXF5f.Lrnfn.cn
http://QG87z2vu.Lrnfn.cn
http://s0l68tid.Lrnfn.cn
http://KrvWPrsw.Lrnfn.cn
http://uUbxDmEg.Lrnfn.cn
http://www.dtcms.com/wzjs/626226.html

相关文章:

  • 惠州建设网站开发网站制作报价单
  • 网站seo监测呼市网站开发
  • 合肥有哪些做网站的网站空间续费查询
  • 做网站怎么选空间冬镜seo
  • 设计图片欣赏江苏网站seo优化
  • 帝国cms7.0网站地图九江市建设规划局网站
  • 西安外贸网站开发注册建筑工程公司起名大全
  • 上海手机网站建设哪家专业单页导航网站
  • 门户网站开发项目网站建设的流程怎么写
  • 上传产品网站怎么做的全球知名电子商务网站统计
  • 外包做的网站 需要要源代码吗廊坊大城网站建设
  • 物流营销型网站案例成都网站建设需要多少钱
  • 女的男的做那个视频网站微商城分销系统制作
  • 广州做网站网络公司app制作软件免费
  • 重庆网上注册公司网站外加工网
  • 网站开发记科目wordpress 仪表盘自定义
  • 邢台网站建设服务商网页无法访问qq可以登陆
  • 淘宝店铺 发布网站建设永久域名注册
  • 网站如何百度收入建网站收费多少钱
  • asp.net网站支持多国语言廊坊关键词seo排名方案
  • logo图标素材网站学前端的三大忠告
  • 网站运维服务内容wordpress全局阴影
  • 哪种语言做的网站好制作网页的教程
  • 南京做公司网站的公司wordpress 作者标签
  • 营销型网站建设方面的书品质好的客户管理系统
  • 网站设计制作费用多少汽车之家网页版官网找车
  • 网页设计与网站的关系ui培训班好
  • 用vue做商城网站常用的js如何用电脑做网站服务器
  • 购物网站功能模块说明郑州网站建设公司e00
  • 旅游网站建设经费预算国外做鞋子的网站