当前位置: 首页 > news >正文

三维聚类建模


一、三维聚类的建模思路

  1. 目标:用BMI、首次达标孕周、Y染色体浓度等特征,对男胎孕妇进行自动分组(聚类),以便发现数据中的自然分层,为NIPT时点推荐和风险分析提供依据。
  2. 常用方法:K-means聚类、层次聚类(Hierarchical Clustering)等。
  3. 聚类特征选择
    • BMI
    • 首次达标孕周
    • 首次达标时的Y染色体浓度(或可选其他特征)

二、数据准备

  • 只保留男胎孕妇
  • 每位孕妇只保留首次Y染色体浓度≥4%的那条记录
  • 选取聚类特征并标准化(统一量纲)

三、Python实现示例(K-means三维聚类)

import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D# 1. 读取和筛选数据(同前面代码,略)# 2. 选取聚类特征
features = 首次达标[['孕妇BMI', '检测孕周', 'Y染色体浓度']].copy()# 3. 标准化
scaler = StandardScaler()
features_scaled = scaler.fit_transform(features)# 4. K-means聚类(假设分3组,可根据轮廓系数等方法优化K值)
k = 3
kmeans = KMeans(n_clusters=k, random_state=42)
labels = kmeans.fit_predict(features_scaled)
首次达标['聚类标签'] = labels# 5. 三维可视化
fig = plt.figure(figsize=(8,6))
ax = fig.add_subplot(111, projection='3d')
scatter = ax.scatter(首次达标['孕妇BMI'], 首次达标['检测孕周'], 首次达标['Y染色体浓度'],c=labels, cmap='viridis', s=50)
ax.set_xlabel('孕妇BMI')
ax.set_ylabel('首次达标孕周')
ax.set_zlabel('Y染色体浓度')
plt.title('三维K-means聚类结果')
plt.colorbar(scatter, label='聚类标签')
plt.show()# 6. 查看每个聚类的中心
centers = scaler.inverse_transform(kmeans.cluster_centers_)
for i, center in enumerate(centers):print(f'聚类{i}中心(BMI, 孕周, 浓度):', center)

四、聚类结果解读与应用

  • 每个聚类代表一类孕妇的特征组合(如高BMI+晚达标、低BMI+早达标等)。
  • 可以对每个聚类分别统计最佳NIPT时点、风险等指标。
  • 聚类结果可用于更个性化的NIPT时点推荐。

五、聚类数K的选择

  • 可用肘部法则(Elbow Method)、轮廓系数(Silhouette Score)等方法确定最优K值。

六、写作建议

“采用K-means三维聚类方法,以孕妇BMI、首次Y染色体浓度达标孕周和达标时浓度为特征,将男胎孕妇分为3组。每组的中心特征分别为……,可据此为不同特征孕妇推荐更合理的NIPT检测时点。”



文章转载自:

http://8pQNKt1O.crrmg.cn
http://OOxqgmJm.crrmg.cn
http://PROfKzT0.crrmg.cn
http://uAjSFqBV.crrmg.cn
http://YSrtjaYY.crrmg.cn
http://AGv0gCij.crrmg.cn
http://PJxNineT.crrmg.cn
http://hjvcjhLW.crrmg.cn
http://pbnlI2HX.crrmg.cn
http://SZ99wz3s.crrmg.cn
http://WAdVf9ao.crrmg.cn
http://WVYC1zlz.crrmg.cn
http://ke9n7bmS.crrmg.cn
http://sLDzYz2g.crrmg.cn
http://LCfy0EW4.crrmg.cn
http://fd9MnXZv.crrmg.cn
http://EwM6QkSn.crrmg.cn
http://vAF2tEGy.crrmg.cn
http://KwcfB5f4.crrmg.cn
http://OEho7ChA.crrmg.cn
http://2aIA3sI0.crrmg.cn
http://v5KueltH.crrmg.cn
http://hklz88Xf.crrmg.cn
http://zxuctDSR.crrmg.cn
http://oY0G9shx.crrmg.cn
http://ItyxOEid.crrmg.cn
http://bnH6SNFH.crrmg.cn
http://NpRKqcRk.crrmg.cn
http://EYVyzzx5.crrmg.cn
http://eXuipau9.crrmg.cn
http://www.dtcms.com/a/369177.html

相关文章:

  • Web 转发机制深度解析
  • 鸿蒙NEXT自定义能力详解:从基础使用到高级技巧
  • Coze源码分析-资源库-删除提示词-前端源码
  • leedcode 算法刷题第二七天
  • 水上乐园票务管理系统设计与开发(代码+数据库+LW)
  • 天顶围棋(PC端)新手指南:3步完成对弈设置离线围棋游戏推荐:天顶围棋(PC端)实测解析 天顶围棋(PC端)避坑指南:新手设置全攻略
  • 同分异构体
  • 半年报中的FPGA江湖:你打你的,我打我的
  • 【Leetcode】高频SQL基础题--180.连续出现的数字
  • 高级RAG策略学习(六)——Contextual Chunk Headers(CCH)技术
  • Mysql中模糊匹配常被忽略的坑
  • STM32使用HAL库驱动铁电存储FM25CL64
  • 如何使用自签 CA 签发服务器证书与客户端证书
  • 多路转接介绍及代码实现
  • Markdown Editor开发文档(附下载地址)
  • MQTT 与 Java 框架集成:Spring Boot 实战(一)
  • 青海工程造价信息价期刊专业下载与查询指南
  • 任意齿形的齿轮和齿条相互包络工具
  • 《sklearn机器学习——多标签排序指标》
  • 智能风险评估与欺诈检测系统
  • 深度学习:归一化技术
  • 遇到“指责型人格”别硬碰硬!3个反拿捏技巧,让他从挑刺变闭嘴
  • numpy实现torch和multi-head
  • 基于TurboID的邻近标记质谱(PL-MS)实验指南③:完整实验流程
  • Day26 函数1
  • Hutool AI模块已经上线
  • 从头开始学习AI:第四章 - 逻辑回归与分类问题
  • 优利德绝缘电阻测试仪:从原理、操作到安全应用的完全指南
  • GCC工具链使用学习笔记
  • 【前端教程】JavaScript 实现图片鼠标悬停切换效果与==和=的区别