当前位置：首页 > news >正文

【开题答辩全过程】以基于大数据抖音用户行为分析的可视化大屏为例，包含答辩的问题和答案

news 2025/10/23 8:48:53

个人简介
一名14年经验的资深毕设内行人，语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持！

各位老师好，我是数据科学与大数据技术专业的 xx 同学。我的课题是“基于大数据抖音用户行为分析的可视化大屏”。系统要做的就是把抖音上的点赞、评论、转发、浏览等数据拿下来，先清洗再分析，最后用大屏把结果画出来，让大家一眼看懂用户喜欢什么、讨厌什么。主要分三大模块：数据采集模块（Python 爬虫）、数据分析模块（Hive+Pandas+K-means 情感分析）、可视化模块（ECharts 大屏）。技术栈就是 Python + Hadoop/Hive + ECharts，机器学习用 K-means 和线性回归，整体跑在本地虚拟机里。

评委老师：数据打算怎么爬？抖音可没有公开接口。
答辩学生：我用的是模拟手机端滑动抓包，找到未加密的 json 地址，每次下滑刷新拿 20 条数据，加上随机等待和换 User-Agent，避免被封 IP。

评委老师：爬下来的数据量有多大？存哪儿？
答辩学生：目前 2 万条左右，先放 CSV，后期上 Hadoop 的 HDFS，一条视频大概 12 个字段，总大小不到 300 M，本地足够。

评委老师：数据清洗主要洗什么？
答辩学生：洗空值、重复值，把“1.2 万”这种字符串点赞数转成数字，再把时间统一成“YYYY-MM-DD”格式，情感分析前还要去表情和特殊符号。

评委老师：用什么做情感分析？准确率大概多少？
答辩学生：用 SnowNLP 快速打标签，分正面、中性、负面，随机抽 200 条人工核对，准确率 78% 左右，够做展示，后续再换更好模型。

评委老师：大屏打算展示哪些图表？
答辩学生：五个图：①日播放量折线；②点赞 TOP10 横向柱图；③情感占比饼图；④用户活跃时段热力图；⑤作品词云。五个图放一页，自动 5 秒轮播。

评委老师：如果老师想实时看到最新数据怎么办？
答辩学生：现在做的是离线版，每天跑一次脚本更新结果；实时版需要接 Kafka+Flink，时间来不及，留在升级计划里。

评委老师：项目最大的难点是什么？
答辩学生：最难是数据获取，抖音反爬升级快，接口可能随时失效，我已经把请求头拆成配置文件，万一失效只改配置不再改代码。

【答辩结束】
评委老师：xx 同学整体思路清晰，技术选型贴合基础，工作量适中，能完成既定目标。建议下一步把 SnowNLP 换成更高准确率的模型，并补充异常 IP 封禁处理。选题应用性强，同意开题，按计划推进即可。

以上是某同学的毕业设计答辩的过程，如果你现在还没有参加答辩，还是开题阶段，已经选好了题目不知道怎么写开题报告，可以下面找找有没有自己符合自己题目的开题报告内容，列表中的开题报告都是往届真实的开题报告，可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学，建议自己多花时间找一下资料（开题报告、源码）自己独立完成毕设，需要开题报告内容、源码参考的，可以联xi博主，没有选题的也可以联系我们进行帮你选题、定功能和建议。

查看全文

http://www.dtcms.com/a/515952.html

长春建站模板温州最牛叉的seo

用 Python 给 Amazon 关键词搜索做“全身 CT”——可量产、可扩展的爬虫实战

从“长音与鼓点”看雷达：连续波雷达与脉冲雷达的原理、公式与工程取舍

未来的 AI 操作系统（八）——灵知之门：当智能系统开始理解存在

[人工智能-大模型-46]：AI时代，什么才是真正的创造者？

【编辑器】一款IDE（如VSCode等）如何解析各类文件大纲及跳转对应行

如何将网站建设得更好包装设计作品集

TypeScript Number

Python 基础语法详解：从顺序到循环

wordpress建网站教程完整网站开发视频教程

数据结构11:二叉树的数据类型和遍历方式

Nanomsg库CMakeLists.txt文件阅读笔记

关于二叉树的一些算法题

上下文工程实践：利用GLM-4.6和TRAE SOLO打造新粗野主义风格音乐创作网站

在网站中添加百度地图注册自己的网站

【基于CAPL进行TXT文件读取】—2.使用指令将读取的文件内容发送到trace

一万个为什么：汉语词性对NLP的作用

Python开发：BackgroundTasks和asyncio.create_task()的区别

InnoDB 独立表空间（ibd 文件）迁移实战指南

22_AI智能体开发架构搭建之基于Redis构建高性能AI对话记忆存储服务实践

SIMPLE

企业专业网站建设wordpress炫酷背景

MTPA算法原理及仿真验证

【记录62】网站输入框搜索内容页面定位

2025年新版ADB工具箱下载+驱动+ADB指令集+fastboot刷机ROOT工具

上海网站建设平台站霸网络快速提升关键词排名软件

【Android】从源码角度理解Handler机制

docker技术之部署docker

node框架做网站国外浏览器推荐

悬赏平台 wordpress免费网站优化怎么做

最后

相关文章：