【开题答辩全过程】以 bilibili排行榜的数据分析与可视化为例,包含答辩的问题和答案
个人简介
一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持!
各位老师好,我是xx同学,本次毕业设计的题目是“Bilibili排行榜的数据分析与可视化”。系统主要分三大模块:数据爬取模块(定时抓取B站日/周/月榜)、数据分析模块(热度走势、分区对比、UP主影响力计算)以及可视化模块(折线图、雷达图、词云、排行榜大屏)。技术栈采用Java+Spring Boot做后台,MySQL存数据,ECharts做前端图表,爬虫用Jsoup,调度用Spring Task,整套部署在Windows本地,后期可考虑迁到云服务器。目前已完成基础爬虫与数据库表设计,预计2025年3月完成全部功能,4月撰写论文,5月准备答辩。
评委老师:为什么选择B站排行榜而不是抖音或微博?
答辩学生:B站排行榜结构清晰、字段固定,接口开放度高,爬取难度低,而且我自己是B站重度用户,对分区内容熟悉,方便做后续分析。
评委老师:系统里“数据分析”具体要算哪些指标?
答辩学生:先算最基础的播放量、点赞量、投币量、收藏量四项,再算一个“综合热度分”=播放量×0.4+点赞×0.3+投币×0.2+收藏×0.1,最后用时间序列看热度走势。
评委老师:相关性分析准备怎么做?
答辩学生:用Pearson系数,把“综合热度分”与“视频时长”“UP主粉丝数”做两两相关,看看长短视频或粉丝基数对热度影响大不大。
评委老师:数据存在MySQL里,表怎么设计的?
答辩学生:主表叫video,字段有bv号、标题、分区、时长、播放量、点赞、投币、收藏、UP主id、抓取日期;另建一张up主表存id、昵称、粉丝数,两张表用UP主id外键关联。
评委老师:爬取频率怎么定,会不会被封IP?
答辩学生:目前每天凌晨2点跑一次,加3秒随机延时,请求头带浏览器User-Agent,再用本地ADSL拨号,IP变了继续跑,测试一周还没遇到验证码。
评委老师:可视化大屏打算放哪些图?
答辩学生:首页放“日榜Top10横条图”,第二屏放“各分区播放量占比饼图”,第三屏放“近30天热度折线”,最底下加词云显示高频标题关键词。
评委老师:如果B站改版接口变了怎么办?
答辩学生:把解析逻辑单独写成一个工具类,接口一变只改这个类,另外抓下来的原始HTML多留一份备份,方便重新解析。
评委老师:做完这个项目你觉得最大收获会是什么?
答辩学生:先把Java Web整条流程跑通,从爬虫、入库、计算到出图,全部自己串一遍,以后工作中换别的数据源也能快速上手。
评委老师总结:xx同学选题贴近生活,技术路线清晰,指标设计简单实用,问答环节对数据表结构、反爬策略和可视化方案都对答如流。建议下一步把“综合热度分”权重用归一化再校验一次,并补充异常值清洗逻辑。整体来看,开题目标明确,进度可控,同意按此方案继续开展,预祝大家后续顺利。
以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取
最后
有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。