一、实验目标
- 使用线性回归模型对给定数据集进行短期趋势预测
- 掌握特征选择、模型训练与评估的全流程
- 对比不同回归算法的预测效果(如普通最小二乘、岭回归等)
二、关键代码实现(带详细注释)
1. 数据预处理
import pandas as pd
from sklearn.preprocessing import StandardScalerdef load_and_preprocess(data_path):"""加载数据并预处理:- 处理缺失值- 时间特征提取- 数据标准化"""df = pd.read_csv(data_path)df['timestamp'] = pd.to_datetime(df['timestamp'])df['hour'] = df['timestamp'].dt.hour df['day_of_week'] = df['timestamp'].dt.dayofweekdf.fillna(method='ffill', inplace=True)X = df.drop(['target_value', 'timestamp'], axis=1)y = df['target_value']scaler = StandardScaler(