当前位置：首页 > news >正文

计算机毕业设计：基于Python的影评情感分析可视化推荐系统

news 2025/9/7 16:10:58

精彩专栏推荐订阅：在下方专栏👇🏻👇🏻👇🏻👇🏻

💖🔥作者主页：计算机毕设木哥🔥 💖

文章目录

一、项目介绍
二、开发环境
三、视频展示
四、项目展示
五、代码展示
六、项目文档展示
七、总结
- <font color=#fe2c24 >大家可以帮忙点赞、收藏、关注、评论啦👇🏻👇🏻👇🏻

一、项目介绍

基于Python的影评情感分析可视化推荐系统是一个集成了自然语言处理技术和推荐算法的综合性Web应用平台。该系统采用Django作为后端框架，结合Vue+ElementUI构建前端界面，通过MySQL数据库存储电影信息、用户数据及影评内容。系统核心功能围绕影评文本的情感分析展开，运用Python的机器学习库对用户评论进行正面、负面及中性情感分类，并将分析结果通过数据可视化技术直观展现。推荐模块基于用户观影历史和情感偏好构建个性化推荐算法，为用户提供精准的电影推荐服务。系统设计了管理员和普通用户两种角色，管理员可以管理电影信息、监控影评数据、处理用户举报，普通用户则能够浏览电影详情、发表影评、参与社区讨论。整个系统架构采用B/S模式，支持多用户并发访问，界面友好且操作便捷。

选题背景
随着互联网娱乐产业的蓬勃发展，在线影评平台逐渐成为观众选择电影的重要参考渠道。用户在观看电影后习惯性地在各大平台分享观影感受，这些海量的评论数据蕴含着丰富的情感信息和观影偏好。传统的影评网站往往仅提供简单的评分机制，无法深度挖掘文本背后的情感倾向，也难以为用户提供个性化的推荐服务。现有的推荐系统多基于协同过滤或内容过滤算法，缺乏对用户情感态度的精确理解。同时，面对庞大的电影数据库和复杂的用户需求，传统的人工审核和分类方式效率低下，难以满足实时性要求。自然语言处理技术的成熟为文本情感分析提供了技术支撑，机器学习算法的优化使得情感分类准确率不断提升。在这样的技术背景下，构建一个能够自动分析影评情感并提供智能推荐的系统变得切实可行，符合当前互联网应用发展的趋势。

选题意义
本课题的研究与实现具有多方面的实际意义。从技术角度来看，该系统整合了自然语言处理、机器学习和Web开发等多个技术领域，为计算机专业学生提供了一个综合性的实践平台，有助于深化对相关技术的理解和应用能力。对于用户而言，系统能够帮助他们更好地理解其他观众的观影感受，通过情感可视化图表直观地了解电影的口碑情况，从而做出更明智的观影选择。推荐功能基于用户的情感偏好进行个性化匹配，能够提升用户的观影体验和满意度。对于电影行业来说，系统产生的情感分析数据可以为制片方和发行方提供市场反馈信息，帮助他们了解观众的真实态度和喜好趋势。学术研究方面，本系统为情感分析算法的实际应用提供了一个具体案例，验证了相关技术在影评领域的可行性和有效性。虽然作为毕业设计项目，系统规模和复杂度有限，但其设计思路和实现方法对同类应用的开发具有一定的借鉴价值。

二、开发环境

大数据技术：Hadoop、Spark、Hive
开发技术：Python、Django框架、Vue、Echarts
软件工具：Pycharm、DataGrip、Anaconda
可视化工具 Echarts

三、视频展示

计算机毕业设计：基于Python的影评情感分析可视化推荐系统

四、项目展示

登录模块：

在这里插入图片描述

首页模块：

在这里插入图片描述

管理模块：

在这里插入图片描述

五、代码展示

from pyspark.sql import SparkSession
from pyspark.sql.functions import col, when, count, avg
from django.http import JsonResponse
from django.db import transaction
from textblob import TextBlob
import jieba
import re
from collections import Counter
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarityspark = SparkSession.builder.appName("MovieReviewAnalysis").config("spark.sql.adaptive.enabled", "true").getOrCreate()@transaction.atomic
def analyze_review_sentiment(request):if request.method == 'POST':review_text = request.POST.get('review_text')movie_id = request.POST.get('movie_id')user_id = request.POST.get('user_id')cleaned_text = re.sub(r'[^\w\s]', '', review_text)words = jieba.lcut(cleaned_text)filtered_words = [word for word in words if len(word) > 1]processed_text = ' '.join(filtered_words)blob = TextBlob(processed_text)sentiment_score = blob.sentiment.polarityif sentiment_score > 0.3:sentiment_label = 'positive'sentiment_value = 1elif sentiment_score < -0.3:sentiment_label = 'negative' sentiment_value = -1else:sentiment_label = 'neutral'sentiment_value = 0review_data = {'movie_id': movie_id,'user_id': user_id,'content': review_text,'sentiment_score': sentiment_score,'sentiment_label': sentiment_label,'sentiment_value': sentiment_value,'word_count': len(filtered_words)}review_instance = MovieReview.objects.create(**review_data)movie = Movie.objects.get(id=movie_id)existing_reviews = MovieReview.objects.filter(movie_id=movie_id)avg_sentiment = existing_reviews.aggregate(avg_score=models.Avg('sentiment_score'))['avg_score']positive_count = existing_reviews.filter(sentiment_value=1).count()negative_count = existing_reviews.filter(sentiment_value=-1).count()total_count = existing_reviews.count()sentiment_distribution = {'positive_ratio': positive_count / total_count if total_count > 0 else 0,'negative_ratio': negative_count / total_count if total_count > 0 else 0,'neutral_ratio': 1 - (positive_count + negative_count) / total_count if total_count > 0 else 0}movie.avg_sentiment = avg_sentimentmovie.review_count = total_countmovie.save()return JsonResponse({'status': 'success','sentiment_label': sentiment_label,'sentiment_score': round(sentiment_score, 3),'sentiment_distribution': sentiment_distribution,'review_id': review_instance.id})def generate_movie_recommendations(request):user_id = request.GET.get('user_id')user_reviews = MovieReview.objects.filter(user_id=user_id).select_related('movie')if not user_reviews.exists():popular_movies = Movie.objects.filter(review_count__gte=10).order_by('-avg_sentiment', '-review_count')[:10]recommendations = [{'movie_id': movie.id, 'title': movie.title, 'reason': '热门推荐'} for movie in popular_movies]return JsonResponse({'recommendations': recommendations})user_sentiment_preferences = {}user_genre_preferences = {}for review in user_reviews:movie_genres = review.movie.genre.split(',')for genre in movie_genres:genre = genre.strip()if genre not in user_genre_preferences:user_genre_preferences[genre] = []user_genre_preferences[genre].append(review.sentiment_value)if review.movie.title not in user_sentiment_preferences:user_sentiment_preferences[review.movie.title] = []user_sentiment_preferences[review.movie.title].append(review.sentiment_value)preferred_genres = []for genre, sentiments in user_genre_preferences.items():avg_sentiment = sum(sentiments) / len(sentiments)if avg_sentiment > 0.2:preferred_genres.append(genre)watched_movie_ids = [review.movie.id for review in user_reviews]candidate_movies = Movie.objects.exclude(id__in=watched_movie_ids).filter(review_count__gte=5)scored_movies = []for movie in candidate_movies:genre_match_score = 0movie_genres = movie.genre.split(',')for genre in movie_genres:if genre.strip() in preferred_genres:genre_match_score += 1genre_match_score = genre_match_score / len(movie_genres) if movie_genres else 0sentiment_score = movie.avg_sentiment if movie.avg_sentiment else 0popularity_score = min(movie.review_count / 100, 1) if movie.review_count else 0final_score = genre_match_score * 0.4 + sentiment_score * 0.4 + popularity_score * 0.2scored_movies.append({'movie': movie,'score': final_score,'genre_match': genre_match_score,'sentiment': sentiment_score})scored_movies.sort(key=lambda x: x['score'], reverse=True)top_recommendations = scored_movies[:8]recommendations = []for item in top_recommendations:movie = item['movie']reason_parts = []if item['genre_match'] > 0.5:reason_parts.append('题材匹配')if item['sentiment'] > 0.3:reason_parts.append('口碑优秀')reason = '、'.join(reason_parts) if reason_parts else '综合推荐'recommendations.append({'movie_id': movie.id,'title': movie.title,'genre': movie.genre,'rating': movie.rating,'reason': reason,'score': round(item['score'], 3)})return JsonResponse({'recommendations': recommendations, 'user_preferences': preferred_genres})def create_sentiment_visualization(request):movie_id = request.GET.get('movie_id')time_period = request.GET.get('period', '30')from datetime import datetime, timedeltaend_date = datetime.now()start_date = end_date - timedelta(days=int(time_period))reviews = MovieReview.objects.filter(movie_id=movie_id,created_at__range=[start_date, end_date]).order_by('created_at')if not reviews.exists():return JsonResponse({'error': '暂无评论数据'})daily_sentiments = {}sentiment_trends = []word_frequency = Counter()for review in reviews:date_key = review.created_at.strftime('%Y-%m-%d')if date_key not in daily_sentiments:daily_sentiments[date_key] = {'positive': 0, 'negative': 0, 'neutral': 0, 'total': 0}if review.sentiment_value == 1:daily_sentiments[date_key]['positive'] += 1elif review.sentiment_value == -1:daily_sentiments[date_key]['negative'] += 1else:daily_sentiments[date_key]['neutral'] += 1daily_sentiments[date_key]['total'] += 1words = jieba.lcut(review.content)filtered_words = [word for word in words if len(word) > 1 and word not in ['电影', '觉得', '感觉', '这个', '还是']]word_frequency.update(filtered_words)for date, sentiments in sorted(daily_sentiments.items()):sentiment_trends.append({'date': date,'positive_ratio': sentiments['positive'] / sentiments['total'],'negative_ratio': sentiments['negative'] / sentiments['total'],'neutral_ratio': sentiments['neutral'] / sentiments['total'],'total_reviews': sentiments['total']})top_words = word_frequency.most_common(20)overall_stats = {'total_reviews': reviews.count(),'positive_count': reviews.filter(sentiment_value=1).count(),'negative_count': reviews.filter(sentiment_value=-1).count(),'neutral_count': reviews.filter(sentiment_value=0).count(),'avg_sentiment': reviews.aggregate(avg=models.Avg('sentiment_score'))['avg']}visualization_data = {'sentiment_trends': sentiment_trends,'word_cloud_data': [{'word': word, 'frequency': freq} for word, freq in top_words],'overall_statistics': overall_stats,'period': time_period}return JsonResponse(visualization_data)

六、项目文档展示

在这里插入图片描述

七、总结

基于Python的影评情感分析可视化推荐系统是一个综合运用自然语言处理、机器学习和Web开发技术的实践项目。本系统通过Django后端框架和Vue前端技术构建了完整的B/S架构应用，实现了影评文本的自动情感分析、数据可视化展示和个性化电影推荐等核心功能。在技术实现方面，系统采用jieba分词和TextBlob库完成中文影评的情感倾向判断，运用TF-IDF算法和余弦相似度计算构建推荐模型，并通过MySQL数据库实现数据持久化存储。

项目的创新点在于将用户的情感偏好融入推荐算法，不仅考虑电影的客观属性，更关注用户的主观感受和情感态度。可视化模块通过图表形式直观展现情感分析结果和趋势变化，为用户提供了更丰富的决策参考信息。虽然作为毕业设计项目，系统在算法复杂度和数据规模上相对有限，但其整体架构设计合理，功能模块划分清晰，具备良好的可扩展性。

通过本课题的实施，不仅锻炼了综合运用多种技术解决实际问题的能力，也加深了对情感计算和推荐系统原理的理解，为后续在相关技术领域的深入学习奠定了基础。