当前位置: 首页 > news >正文

【开题答辩全过程】以 基于大数据抖音用户行为分析的可视化大屏为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Javaphp、微信小程序、PythonGolang、安卓Android

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是数据科学与大数据技术专业的 xx 同学。我的课题是“基于大数据抖音用户行为分析的可视化大屏”。系统要做的就是把抖音上的点赞、评论、转发、浏览等数据拿下来,先清洗再分析,最后用大屏把结果画出来,让大家一眼看懂用户喜欢什么、讨厌什么。主要分三大模块:数据采集模块(Python 爬虫)、数据分析模块(Hive+Pandas+K-means 情感分析)、可视化模块(ECharts 大屏)。技术栈就是 Python + Hadoop/Hive + ECharts,机器学习用 K-means 和线性回归,整体跑在本地虚拟机里。


评委老师:数据打算怎么爬?抖音可没有公开接口。
答辩学生:我用的是模拟手机端滑动抓包,找到未加密的 json 地址,每次下滑刷新拿 20 条数据,加上随机等待和换 User-Agent,避免被封 IP。


评委老师:爬下来的数据量有多大?存哪儿?
答辩学生:目前 2 万条左右,先放 CSV,后期上 Hadoop 的 HDFS,一条视频大概 12 个字段,总大小不到 300 M,本地足够。


评委老师:数据清洗主要洗什么?
答辩学生:洗空值、重复值,把“1.2 万”这种字符串点赞数转成数字,再把时间统一成“YYYY-MM-DD”格式,情感分析前还要去表情和特殊符号。


评委老师:用什么做情感分析?准确率大概多少?
答辩学生:用 SnowNLP 快速打标签,分正面、中性、负面,随机抽 200 条人工核对,准确率 78% 左右,够做展示,后续再换更好模型。


评委老师:大屏打算展示哪些图表?
答辩学生:五个图:①日播放量折线;②点赞 TOP10 横向柱图;③情感占比饼图;④用户活跃时段热力图;⑤作品词云。五个图放一页,自动 5 秒轮播。


评委老师:如果老师想实时看到最新数据怎么办?
答辩学生:现在做的是离线版,每天跑一次脚本更新结果;实时版需要接 Kafka+Flink,时间来不及,留在升级计划里。


评委老师:项目最大的难点是什么?
答辩学生:最难是数据获取,抖音反爬升级快,接口可能随时失效,我已经把请求头拆成配置文件,万一失效只改配置不再改代码。


【答辩结束】
评委老师:xx 同学整体思路清晰,技术选型贴合基础,工作量适中,能完成既定目标。建议下一步把 SnowNLP 换成更高准确率的模型,并补充异常 IP 封禁处理。选题应用性强,同意开题,按计划推进即可。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题定功能和建议

http://www.dtcms.com/a/515952.html

相关文章:

  • 长春建站模板温州最牛叉的seo
  • 用 Python 给 Amazon 关键词搜索做“全身 CT”——可量产、可扩展的爬虫实战
  • 从“长音与鼓点”看雷达:连续波雷达与脉冲雷达的原理、公式与工程取舍
  • 未来的 AI 操作系统(八)——灵知之门:当智能系统开始理解存在
  • [人工智能-大模型-46]:AI时代,什么才是真正的创造者?
  • 【编辑器】一款IDE(如VSCode等) 如何解析各类文件大纲及跳转对应行
  • 如何将网站建设得更好包装设计作品集
  • TypeScript Number
  • Python 基础语法详解:从顺序到循环
  • wordpress建网站教程完整网站开发视频教程
  • 数据结构11:二叉树的数据类型和遍历方式
  • Nanomsg库CMakeLists.txt文件阅读笔记
  • 关于二叉树的一些算法题
  • 上下文工程实践:利用GLM-4.6和TRAE SOLO打造新粗野主义风格音乐创作网站
  • 在网站中添加百度地图注册自己的网站
  • 【基于CAPL进行TXT文件读取】—2.使用指令将读取的文件内容发送到trace
  • 一万个为什么:汉语词性对NLP的作用
  • Python开发:BackgroundTasks和asyncio.create_task()的区别
  • InnoDB 独立表空间(ibd 文件)迁移实战指南
  • 22_AI智能体开发架构搭建之基于Redis构建高性能AI对话记忆存储服务实践
  • SIMPLE
  • 企业专业网站建设wordpress炫酷背景
  • MTPA算法原理及仿真验证
  • 【记录62】网站输入框搜索内容页面定位
  • 2025年新版ADB工具箱下载+驱动+ADB指令集+fastboot刷机ROOT工具
  • 上海网站建设平台站霸网络快速提升关键词排名软件
  • 【Android】从源码角度理解Handler机制
  • docker技术之部署docker
  • node框架做网站国外浏览器推荐
  • 悬赏平台 wordpress免费网站优化怎么做