当前位置: 首页 > wzjs >正文

高端企业网站建设注意问题优化百度涨

高端企业网站建设注意问题,优化百度涨,江西南昌高新区疫情最新消息,服务器做ssr后还可以做网站吗项目目标: 基于房屋特征(如房间数、地理位置等)预测加州地区的房价中位数。 使用 Python 实现机器学习的 房价预测回归项目(使用 California Housing 数据集) 环境准备 # 安装必要库(若未安装&#xff09…

项目目标:

      基于房屋特征(如房间数、地理位置等)预测加州地区的房价中位数。

      使用 Python 实现机器学习的 房价预测回归项目(使用 California Housing 数据集)

环境准备

# 安装必要库(若未安装)
# pip install numpy pandas matplotlib scikit-learn seaborn
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error, r2_score

完整代码实现

步骤 1: 加载数据集
# 加载加州房价数据集
california = fetch_california_housing()
X = california.data  # 特征数据
y = california.target  # 目标变量(房价中位数,单位:万美元)
feature_names = california.feature_namesprint("特征名称:", feature_names)
print("样本数量:", X.shape[0])
print("特征数量:", X.shape[1])
步骤 2: 数据探索
# 转换为DataFrame
df = pd.DataFrame(X, columns=feature_names)
df['MedHouseVal'] = y# 查看数据概览
print("\n数据前5行:")
print(df.head())# 统计信息
print("\n数据描述:")
print(df.describe())# 绘制房价分布图
plt.figure(figsize=(8,5))
sns.histplot(df['MedHouseVal'], bins=50, kde=True)
plt.title("房价中位数分布")
plt.xlabel("房价(万美元)")
plt.show()# 特征相关性热力图
plt.figure(figsize=(10,8))
corr_matrix = df.corr()
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')
plt.title("特征相关性矩阵")
plt.show()
步骤 3: 数据预处理
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42
)# 特征标准化
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
步骤 4: 模型训练与比较
# 初始化模型
models = {"Linear Regression": LinearRegression(),"Decision Tree": DecisionTreeRegressor(max_depth=5)
}# 训练与评估
results = {}
for name, model in models.items():model.fit(X_train_scaled, y_train)y_pred = model.predict(X_test_scaled)# 计算指标mse = mean_squared_error(y_test, y_pred)r2 = r2_score(y_test, y_pred)results[name] = {"MSE": round(mse, 2),"R²": round(r2, 3)}# 展示结果
print("\n模型性能对比:")
for model_name, metrics in results.items():print(f"{model_name}:")print(f"  MSE: {metrics['MSE']}")print(f"  R²分数: {metrics['R²']}\n")
步骤 5: 结果可视化
# 获取最佳模型预测结果
best_model = LinearRegression()
best_model.fit(X_train_scaled, y_train)
y_pred = best_model.predict(X_test_scaled)# 绘制实际值与预测值对比
plt.figure(figsize=(8,6))
plt.scatter(y_test, y_pred, alpha=0.5)
plt.plot([0, 5], [0, 5], 'r--')  # 理想对角线
plt.xlabel("实际房价")
plt.ylabel("预测房价")
plt.title("实际值 vs 预测值")
plt.show()# 绘制残差图
residuals = y_test - y_pred
plt.figure(figsize=(8,6))
sns.histplot(residuals, kde=True)
plt.title("残差分布")
plt.xlabel("预测误差")
plt.show()
步骤 6: 特征重要性分析(决策树)
# 获取决策树特征重要性
dt_model = DecisionTreeRegressor(max_depth=5).fit(X_train_scaled, y_train)
importances = dt_model.feature_importances_# 可视化特征重要性
plt.figure(figsize=(10,6))
sns.barplot(x=importances, y=feature_names, palette="viridis")
plt.title("特征重要性排序(决策树模型)")
plt.xlabel("重要性分数")
plt.show()

输出示例

特征名称: ['MedInc', 'HouseAge', 'AveRooms', 'AveBedrms', 'Population', 'AveOccup', 'Latitude', 'Longitude']
样本数量: 20640
特征数量: 8模型性能对比:
Linear Regression:MSE: 0.56R²分数: 0.602Decision Tree:MSE: 0.68R²分数: 0.517

关键分析点

  1. 数据特征MedInc(收入中位数)与房价正相关最强

  2. 模型对比:线性回归表现优于决策树(R²分数更高)

  3. 残差分析:误差大致呈正态分布,但存在高价房低估现象

  4. 地理因素:经度(Longitude)在决策树中显示较高重要性

扩展建议

  1. 尝试其他回归模型(随机森林、梯度提升树)

  2. 添加特征交互项(如收入×房间数)

  3. 使用网格搜索优化超参数

  4. 将经纬度转换为地理位置聚类特征

  5. 部署为API服务(使用Flask/FastAPI)

 

http://www.dtcms.com/wzjs/516906.html

相关文章:

  • logo在线制作免费网站东莞网站seo优化托管
  • 怎么做外国网站卖东西四川seo快速排名
  • 网站开发公司北京网络推广外包费用
  • 新网站怎么做seo百度一下 你就知道首页
  • 做一家开发网站的公司简介企业邮箱注册
  • 网站建设及维护合同没有限制的国外搜索引擎
  • 关于做网站的策划书鸿星尔克网络营销
  • 广州正佳广场官网东莞优化怎么做seo
  • 零售网站有哪些平台如何写好一篇软文
  • 怎么做wp网站最近发生的重大新闻
  • 德阳网站建设公司哪家好营销型网站开发公司
  • 网站建设视频图片网站的推广平台有哪些
  • wordpress 侧边栏浮动枫树seo
  • 苏州做网站费用明细南宁网站推广公司
  • web网站开发学院百度关键词分析工具
  • 市住房城乡建设部网站seo体系百科
  • 如何自己做时时彩网站网络营销公司如何建立
  • 可以做调查的网站品牌seo培训
  • 3.常见的网站建设工具有百度网盘搜索引擎盘多多
  • 做网站要运用到代码吗旧版优化大师
  • 网站 多语言处理最常用的搜索引擎有哪些
  • 购物导购网站开发他达拉非片和伟哥区别
  • 软件开发外包公司赚钱不优化设计七年级上册语文答案
  • 做直播网站需要证书吗网页制作接单平台
  • 本地生活网站建设淘宝网店代运营正规公司
  • 做网站需要什么系统自助网站建设
  • 江苏中兴建设有限公司网站国内最新消息
  • 东莞网站建设地点优化seo推广软件
  • 手机网站编程免费域名解析平台
  • 陕西网站开发公司张文宏说上海可能是疫情爆发