【开题答辩全过程】以 Boss直聘网站数据分析与可视化为例,包含答辩的问题和答案
个人简介
一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持!
各位老师好,我是 2021 级数据科学与大数据技术专业的 xx 同学。我的题目是《Boss 直聘网站数据分析与可视化》。系统做的事很简单:先把 Boss 直聘上的岗位信息爬下来,接着把脏数据洗掉,再用图表把“哪个城市工资高、什么学历最吃香、哪些岗位最缺人”画出来,最后做成一个网页大屏,让求职者一眼看懂就业行情。一共四大模块:数据爬取、数据清洗、数据分析、可视化展示。技术栈用的全是最基础的 Python 工具——requests+BeautifulSoup 爬数据,pandas 洗数据,matplotlib/seaborn 画图,Streamlit 把图搬到网页上。下面请各位老师提问!
评委老师:为什么选择 Boss 直聘,而不选前程无忧或拉勾?
答辩学生:Boss 直聘页面结构最简单,反爬最弱,字段也最全,对我这种基础弱的人最容易上手。
评委老师:你爬哪些字段?打算存成什么格式?
答辩学生:就爬 7 个字段——岗位名、城市、薪资、学历、经验、公司名称、发布日期。先存 CSV,后面分析再读进 DataFrame。
评委老师:数据清洗这一步具体怎么洗?
答辩学生:三步:去重、去空、把薪资转成数字。比如“8-12K”先拆成 8000 和 12000,再取平均数,方便后面画柱状图。
评委老师:可视化部分你准备画几张图?
答辩学生:计划 5 张:城市平均薪资柱状图、学历要求饼图、岗位数量折线图、经验要求直方图,还有一张综合大屏把它们拼一起。
评委老师:用到了机器学习吗?
答辩学生:暂时没有,我就做描述性统计和画图,机器学习留到后期如果时间够,再试试聚类看岗位分类。
评委老师:系统最后怎么展示?
答辩学生:用 Streamlit 搭个轻量级网页,本地跑起来,老师点开就能看到图,不用装额外环境。
评委老师:如果网站改版,字段变了怎么办?
答辩学生:我在代码里把 CSS 选择器单独写成配置文件,一改只改配置,主程序不动,十分钟能修好。
评委老师:进度安排能赶上吗?
答辩学生:能!寒假先把爬虫和清洗写完,开学两周出图,第八学期第 6 周前交论文初稿,留一个月查重和做 PPT。
【评委评价与总结】
xx 同学选题贴近专业,目标明确,技术路线简单可行,工作量对本科生合适。能清楚说出每步做什么、用什么库、出什么图,说明对项目已经整体跑通过一遍。后期注意把“数据更新”“反爬策略”两点再补一段文字即可。总体同意开题,按计划推进,预祝你顺利完成毕业设计!
以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取
最后
有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。