Datawhale AI数据分析 作业3
比特币10年价格数据(2014-2024)
比特币市场作为全球首个且最知名的加密货币市场,以其高度的波动性、全球化的交易网络以及去中心化的特性而著称。自2009年比特币诞生以来,在市场情绪、政策变化、技术进步等多重因素共同作用下,它经历了频繁的大幅价格波动,这些波动不仅体现了投资者对比特币价值的认知变化,同时也映射出全球经济环境和技术发展的脉络。这种“疯狂”的市场行为提供了一个极佳的实验场,可以帮助我们更深入地理解金融市场中的风险管理和投资策略。
本数据集包含 2014 - 2024 的比特币美元价格数据,具体包含比特币每日的开盘价、最高价、最低价、收盘价以及成交量等关键信息。
基本数据统计与可视化prompt 1:
对数据进行初步探索,包括显示前5行和后5行,查看数据类型和缺失值情况。然后,为“Open”、“High”、“Low”、“Close”、“Adj Close”和“Volume”列生成描述性统计信息(例如,均值、中位数、标准差、最小值、最大值)。最后,绘制比特币每日收盘价(Close)的时间序列图,并绘制一个展示每日成交量(Volume)的柱状图。确保图表标题清晰,坐标轴标签明确。
价格波动与趋势分析prompt 2:
计算比特币的每日回报率(Daily Returns)。绘制每日回报率的直方图,并计算其均值和标准差。此外,计算并绘制比特币月度平均收盘价和年度平均收盘价的趋势图,以观察长期价格趋势。在图表中突出显示任何显著的趋势变化或周期性模式。
成交量与市场波动关系分析prompt 3:
分析比特币成交量(Volume)与价格波动(例如,每日价格范围
High - Low
或收盘价变动Close - Open
)之间的关系。计算并可视化成交量与每日价格范围之间的散点图,并计算它们的相关系数。解释相关系数的含义。此外,分析高成交量时期是否通常伴随更大的价格波动,并用图表(例如,箱线图或折线图)展示这种关系。
价格异常波动检测、成交量异常值检测prompt 4:
进行比特币价格异常波动检测。定义异常波动为每日收盘价变化超过3个标准差的情况。列出并可视化所有检测到的异常波动日期及其对应的收盘价变化。同时,对成交量(Volume)进行异常值检测,使用IQR方法(四分位距方法),识别并列出所有成交量异常值对应的日期和成交量。可视化成交量异常值分布。
市场特征聚类分析prompt 5:
选择合适的市场特征(例如,每日价格波动幅度
High - Low
、每日回报率、成交量变化率等)进行聚类分析。首先,对这些特征进行标准化处理。然后,尝试使用K-Means算法将交易日聚类成不同市场状态(例如,高波动高成交、低波动低成交等)。通过肘部法则(Elbow Method)确定最佳聚类数量。可视化聚类结果,例如使用PCA降维后在二维平面上绘制聚类点,并对每个聚类的特征进行描述性分析,解释不同聚类代表的市场特征。
时间序列分析与预测prompt 6:
进行时间序列分析与预测。首先,对收盘价数据进行平稳性检验(例如,ADF检验)。如果数据不平稳,进行差分处理。然后,绘制ACF和PACF图以确定合适的ARIMA模型阶数。选择一个合适的ARIMA模型(或考虑使用更复杂的模型如SARIMA、Prophet、LSTM,如果数据量和复杂度允许),并使用历史数据训练模型。最后,使用训练好的模型预测未来30天的比特币收盘价,并可视化预测结果与实际价格(如果可得)的对比,以及预测区间。
比特币价格回归分析prompt 7:
进行比特币价格的回归分析。选择“Close”价格作为因变量,选择“Open”、“High”、“Low”和“Volume”作为自变量。构建一个多元线性回归模型来预测收盘价。评估模型的性能,包括R平方、调整R平方、均方误差(MSE)和均方根误差(RMSE)。分析每个自变量对收盘价的影响(系数和P值)。此外,可以考虑引入时间相关的特征(例如,滞后价格、移动平均线)来改进回归模型,并对改进后的模型进行评估和解释。
请给我预测30的结果,并用表格形式。
下面是比特币的市场信息交易信息,请对比预测值和真实值,评估模型的准确度
以下是比特币在2024年1月22日至2月22日期间的主要交易数据汇总,基于搜索结果中的相关信息整理而成:
Date | Open (USD) | High (USD) | Low (USD) | Close (USD) | Volume (USD) |
---|---|---|---|---|---|
2024-01-22 | ~39,800 | ~40,200 | ~38,500 | ~39,950 | ~25.5B |
2024-01-24 | ~39,500 | ~40,000 | ~38,800 | ~40,000 | ~28.1B |
2024-02-15 | ~51,200 | ~52,660 | ~50,800 | ~52,500 | ~35.2B |
2024-02-18 | ~51,800 | ~52,323 | ~50,900 | ~52,323 | ~32.7B |
2024-02-19 | ~52,100 | ~52,500 | ~51,700 | ~52,323 | ~30.9B |
2024-02-22 | ~52,005 | ~52,800 | ~51,200 | ~52,300 | ~29.5B |