【开题答辩全过程】以 python杭州亚运会数据分析与可视化开题为例,包含答辩的问题和答案
个人简介
一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持!
各位老师好,我是xx同学,我的题目是“基于Python的杭州亚运会数据分析与可视化”。系统主要做三件事:先把比赛数据爬下来并洗干净,接着用Python做统计分析和机器学习预测,最后把结果做成图表、地图和实时看板,方便主办方、教练和观众一眼看懂。功能分四大块:数据收集、数据分析、可视化展示和用户查询。技术栈就是Python+Pandas+Flask,可视化用PyEcharts,数据库用MySQL,前后端分离,页面简单好操作。下面请各位老师提问。
评委老师:数据从哪里来?如果官网没有开放API怎么办?
答辩学生:我打算先找官网、维基百科和新浪体育这些公开网页,用Requests+BeautifulSoup爬;万一没有接口,就把网页另存为HTML,用正则或Pandas读表格,手工补全缺失值,数据量不大,几百条就够分析。
评委老师:用什么指标判断“运动员表现”好坏?
答辩学生:我选三个简单指标:平均成绩/得分、奖牌数和破纪录次数,全部量化成数字,这样柱状图和雷达图都能直接画。
评委老师:预测比赛结果打算用什么算法?数据量这么小会不会不准?
答辩学生:先用线性回归试试,比如用历史成绩预测决赛成绩;数据少我就做“国家层面”汇总,不按个人预测,这样一条数据代表一个国家队,误差看起来就不会太大。
评委老师:可视化里“实时”怎么实现?真能做到秒级刷新吗?
答辩学生:老师,我这里的“实时”是“准实时”,页面每30秒用Ajax向Flask请求一次最新CSV,CSV是我提前跑好的统计结果,手工更新,不连赛事系统,演示时看起来是动的就行。
评委老师:系统最终跑在哪里?需要安装很多软件吗?
答辩学生:做成最简版:后台Python脚本+Flask,前端单HTML页面,数据库用轻量级SQLite,拷到一台普通笔记本就能跑,评委老师点开浏览器就能看,零安装。
【答辩结束·评委评价】
xx同学选题贴近热点,技术路线清晰,选用工具简单实用,能站在“基础差”的角度把复杂问题拆成“小步快跑”,值得肯定。下一步重点:1.把数据源落实在可爬到的页面并提前备份;2.预测部分先保证“有图”再谈精度;3.界面做3个核心图即可,忌贪大。总体开题可行,同意进入下一阶段,加油。
以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取
最后
有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。