医科+AI!和鲸支持南京医科大学医学数据挖掘课程实践教学落地
近两年,生物统计学更多地进入了公众视野。作为统计学、医学与计算机科学交叉的前沿学科,伴随测序技术革新与人工智能算法突破,其发展前景也被十分看好。
市场需求的背后是人才需求的爆发与人才培养的挑战。目前,生物统计学专业在国内仍处于发展初期,全国仅有八所高校开设相关专业。但在本科阶段系统学习统计学方法与计算机技术,已逐渐成为医学生提升竞争力的重要选择;而推进医工、医理交叉融合,也成为医学院校加速 “新医科” 建设、推进教学改革的关键方向。
本文将分享南京医科大学公共卫生学院生物统计学系基于和鲸 ModelWhale 教学实训平台,开展《生物医学数据挖掘》课程教学实施的落地过程,以期为国内医学院校在医学专业背景学生中推进 “医学+AI” 融合课程教学,提供可参考的思路与实践经验。
课程背景:立足学科前沿,与时俱进
南京医科大学公共卫生与预防医学学科在教育部第四、五轮学科评估中均获 A + 评级,同时入选国家 “双一流” 建设学科,其生物统计学专业在 2024 年软科专业排名中位居 1/4 。
在专业培养理念上,《生物医学数据挖掘》课程负责人,南京医科大学生物统计学副教授沈思鹏老师告诉我们,每一届学生都印在心里有这样一句话:“明计数识天下”。这里的 “计数”,不仅包括概率论、贝叶斯公式等基础理论知识,更强调通过数据分析获得有价值的结论。
生物统计学在精准医疗、临床试验、药物筛选、流行病学分析、组学分析等前沿领域发挥着不可替代的作用。近年来,大型人群队列研究和多组学分析成为学科热点方向,但这些前沿研究都需要更先进的人工智能方法和高效的算法。可以说,生物医学数据的迭代、生物统计学与人工智能的结合对学生的认知与技能培养提出了更高要求。
基于上述“与时俱进”的需求背景,生物统计学专业面向大三学生开设了《生物医学数据挖掘》课程。培养生物医学数据的挖掘思维和编程能力是课程的主要目标,在此基础上,课程同时致力于拓展学生对生物医学前沿领域研究的认知,并培养学生处理大型复合多组学人群队列数据的分析技能。
课程实施:重视实践教学,深化平台赋能
课件、作业、计算、考试一站式
课程内容的核心知识点主要分为三块:编程能力、组学研究与人工智能,并以案例“肺癌的病因是什么”具体展开,通过探索肺癌与宏观流行病因素的关系、与遗传的关系、与蛋白的关系等,让学生掌握不同的数据挖掘技能。
为提高课程内容的前沿性,沈老师精心筛选了近十年生物医学数据挖掘领域的核心文献,连同教案上传至每周的课件处,形成云端学习资源库,培养同学们的科研兴趣。点开平台上课程大纲,教学课件、关联了数据集的项目文件、研究文献等学习资料一目了然,学生可根据学习进度自主开展课前预习与课后复习。
“我们用的示例数据—— UK Biobank、英国生物样本库,以及其他材料都是比较前沿的,很多都是学生在硕博阶段才会接触到的,但我们把它提前地下放到了本科阶段,就是希望学生能提前培养前沿的数据挖掘思维。”
与此同时,和鲸社区丰富的数据资源与实践项目也成为课程教学的重要补充。比如医学统计系列 workshop 聚焦应用 Python/R 语言解决具体场景问题,可与课程机器学习模块形成有效衔接,为学生提供课外强化训练。
云计算环境支持40余名学生在线运行
在课程安排上,沈老师表示非常重视学生对于实践的参与,每堂课程时长为三个学时(合计 2 小时),具体划分为“生物医学挖掘背景”“生物统计方法学介绍”“学生练习随堂作业并提交”三部分,相当于每节课都预留一个学时,让学生能够充分开展实践 。
以大型队列人群挖掘为例,沈老师提前将 UK Biobank 示例数据上传至和鲸平台并共享给学生,同学们在课堂上即可自行挂载数据完成数据导入、清洗与预处理,并用统计学模型去分析肺癌发病与相关流行病学暴露因素的关联性。这种教学模式带来了两个明显的好处:一方面,通过随堂作业提交情况可实时评估学生知识掌握程度;另一方面,学生出勤与听课的积极性、参与度也显著提高。
但高强度的实践教学也带来了新的挑战。生物统计学是真正的“大数据”专业,对计算资源有着极高的要求,学生使用个人电脑往往难以支撑算法的运行。开课前,沈思鹏老师曾提出疑虑:“一个班级 40 余名学生同时在线运行数据分析任务,平台能否稳定承载?”
实际教学过程给出了肯定的答案。和鲸 ModelWhale 平台基于 Jupyter Notebook 搭建统一的云端计算环境,学生仅需通过浏览器即可调用平台算力资源,有效保障了随堂作业的顺利开展。作业提交后,教师可直接在平台上在线运行学生代码,实时查看作业完成情况并给予反馈。
经过多轮课程实践验证,课程的期中与期末考核同样依托平台高效完成,充分证明了平台在支撑大规模实践教学中的可靠性与稳定性。
面向未来的课程建设,沈老师提出,计划在课程中逐步引入深度学习数据挖掘的经典案例,同时,进一步深化大模型对教学的赋能作用,加强学生与大模型的交互,如借助大模型辅助学生编程,通过生成虚拟数据开展虚拟仿真式教学等。这不仅是沈老师对课程优化的展望,也是和鲸平台持续迭代的方向。
和鲸已与众多医学院校、医院展开合作,期待能助力更多院校创新课程模式,加速医学教育与前沿技术的融合进程,培养出更多适应行业需求的复合型医学人才 。