当前位置: 首页 > news >正文

【开题答辩全过程】以 bilibili排行榜的数据分析与可视化为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Javaphp、微信小程序、PythonGolang、安卓Android

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是xx同学,本次毕业设计的题目是“Bilibili排行榜的数据分析与可视化”。系统主要分三大模块:数据爬取模块(定时抓取B站日/周/月榜)、数据分析模块(热度走势、分区对比、UP主影响力计算)以及可视化模块(折线图、雷达图、词云、排行榜大屏)。技术栈采用Java+Spring Boot做后台,MySQL存数据,ECharts做前端图表,爬虫用Jsoup,调度用Spring Task,整套部署在Windows本地,后期可考虑迁到云服务器。目前已完成基础爬虫与数据库表设计,预计2025年3月完成全部功能,4月撰写论文,5月准备答辩。


评委老师:为什么选择B站排行榜而不是抖音或微博?
答辩学生:B站排行榜结构清晰、字段固定,接口开放度高,爬取难度低,而且我自己是B站重度用户,对分区内容熟悉,方便做后续分析。


评委老师:系统里“数据分析”具体要算哪些指标?
答辩学生:先算最基础的播放量、点赞量、投币量、收藏量四项,再算一个“综合热度分”=播放量×0.4+点赞×0.3+投币×0.2+收藏×0.1,最后用时间序列看热度走势。


评委老师:相关性分析准备怎么做?
答辩学生:用Pearson系数,把“综合热度分”与“视频时长”“UP主粉丝数”做两两相关,看看长短视频或粉丝基数对热度影响大不大。


评委老师:数据存在MySQL里,表怎么设计的?
答辩学生:主表叫video,字段有bv号、标题、分区、时长、播放量、点赞、投币、收藏、UP主id、抓取日期;另建一张up主表存id、昵称、粉丝数,两张表用UP主id外键关联。


评委老师:爬取频率怎么定,会不会被封IP?
答辩学生:目前每天凌晨2点跑一次,加3秒随机延时,请求头带浏览器User-Agent,再用本地ADSL拨号,IP变了继续跑,测试一周还没遇到验证码。


评委老师:可视化大屏打算放哪些图?
答辩学生:首页放“日榜Top10横条图”,第二屏放“各分区播放量占比饼图”,第三屏放“近30天热度折线”,最底下加词云显示高频标题关键词。


评委老师:如果B站改版接口变了怎么办?
答辩学生:把解析逻辑单独写成一个工具类,接口一变只改这个类,另外抓下来的原始HTML多留一份备份,方便重新解析。


评委老师:做完这个项目你觉得最大收获会是什么?
答辩学生:先把Java Web整条流程跑通,从爬虫、入库、计算到出图,全部自己串一遍,以后工作中换别的数据源也能快速上手。


评委老师总结:xx同学选题贴近生活,技术路线清晰,指标设计简单实用,问答环节对数据表结构、反爬策略和可视化方案都对答如流。建议下一步把“综合热度分”权重用归一化再校验一次,并补充异常值清洗逻辑。整体来看,开题目标明确,进度可控,同意按此方案继续开展,预祝大家后续顺利。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题定功能和建议

http://www.dtcms.com/a/398686.html

相关文章:

  • AI性能对决!蓝耘MaaS平台在2025大模型测评中如何脱颖而出
  • 新能源知识库(109)什么是频率死区?
  • Linux开发——开发板介绍及裸机程序设计
  • 百度网站推广关键词怎么查凡科微信小程序怎么样
  • 定制网站开发接活wordpress固定链接设置技巧
  • HTTP代理HTTP(S)、SOCKS5有哪些作用?
  • vue3+TS 前端调用海康摄像头视频流,后端用 Node.js 做 RTSP 转 WebSocket-FLV 转发,并且前后端优化延迟方案
  • 计算机视觉(opencv)练习——抠图(图像裁剪与轮廓提取)
  • 网站建设知识点的总结怎么做网站一个平台
  • 西安做网站的在网站后台设置wap模板目录
  • 软件行业|Parasoft与IAR的嵌入式DevOps测试集成
  • 设计模式-状态模式详解
  • 微信小程序通用弹窗组件封装与动画实现
  • 「日拱一码」099 数据处理——降维
  • 速通ACM省铜第十三天 赋源码(Watermelon)
  • 【C++进阶系列】:位图和布隆过滤器(附模拟实现的源码)
  • 洛阳网站建设建站系统怎么删除网站的死链
  • 山东省城乡建设厅网站wordpress academia
  • 广州番禺服装网站建设济南网站优化
  • 下载huggingface中数据集/模型
  • vue事件循环机制
  • 分布式专题——19 Zookeeper分布式一致性协议ZAB源码剖析
  • 前端核心框架vue之(组件篇2/5)
  • 【分布式】分布式事务方案:两阶段、TCC、SEATA
  • Kafka介绍
  • Netty 解码器 DelimiterBasedFrameDecoder
  • 位运算 常见方法总结 算法练习 C++
  • 电子商务平台网站源码国外炫网站
  • PTZ相机的知识体系
  • Nginx反向代理配置全流程实战:从环境搭建到HTTPS部署