54 lines
3.7 KiB
Markdown
54 lines
3.7 KiB
Markdown
## 热力图解读
|
||
热力图显示了各指标之间的相关性。颜色越深表示相关性越强,颜色越浅表示相关性越弱,偏红色表示正相关,偏蓝色表示负相关。
|
||
1. 图形大致可分为四个部分:
|
||
- 左上角的颜色较深的矩形反映了AQI与数个观测指标(污染物)的关系。
|
||
- 右上侧有一些颜色较深的区块,可能反映了污染物(如CO、NO2、O3)浓度与环境因素(如温度、湿度、风速)的相关关系。
|
||
- 中心与中心正右侧的深色区块反映温度与气压间的强负相关关系。
|
||
- 右下角的颜色较深的矩形主要反映各环境指标间的相关关系。
|
||
2. 空气质量指数(AQI)与PM2.5、PM10有很强正相关关系,与CO、NO2、SO2呈现较强正相关关系。同时跟VV(水平能见度)有较强负相关关系。后者的原因显然。经过查阅资料,前者数个指标本就为AQI的计算所考虑的指标,而同为考虑指标的O3相关性低,不知道为什么,需要进一步调研。
|
||
3. 小时(hour)与O3等指标呈现一定正相关关系,这或许反映O3浓度变化具有日周期。且与U(地面高度2米处的相对湿度)等指标呈现一定负相关关系。
|
||
## 主成分分析解读
|
||
1. 检验指标:
|
||
- KMO值: 0.762>0.7。
|
||
- 巴赫利特检验卡方值: 90424.712, p值: 0.0,显著。
|
||
- 提取5个特征值大于1的因子作为主成分,累积方差贡献率为78.89%。
|
||
- 检验效果较好,说明数据适合主成分分析降维。
|
||
2. 旋转载荷矩阵解读:
|
||
1) Factor1(温度气压因子)
|
||
- 高载荷变量:
|
||
Tn (-0.963), T (-0.958), Tx (-0.954), P (0.924), Po (0.921), Td (-0.898)
|
||
- 物理意义:
|
||
主要反映温度(T, Tn, Tx)和气压(P, Po)相关指标的强负相关关系(温度越高,气压越低)。
|
||
2) Factor2(颗粒物污染因子)
|
||
- 高载荷变量:
|
||
AQI (0.967), PM10 (0.933), PM2.5 (0.879)
|
||
- 物理意义:
|
||
直接反映空气质量指数(AQI)和颗粒物污染(PM10, PM2.5),空气质量问题代表颗粒物污染主导。
|
||
3) Factor3(大气条件与污染物因子)
|
||
- 高载荷变量:
|
||
U (-0.824), Ff (0.772), NO2 (-0.728), CO (-0.695), VV (0.667)
|
||
- 物理意义:
|
||
风速增加(Ff)与相对湿度(U)负相关,与能见度(VV)正相关。
|
||
同时风速增加(Ff)与污染物浓度(NO2、CO负载荷)的负相关关系可能暗示了风对大气污染物的扩散作用。
|
||
4) Factor4(因子)
|
||
- 高载荷变量:
|
||
Pa (-0.747), SO2 (0.694)
|
||
- 物理意义:难以解释。
|
||
5) Factor5(降水因子)
|
||
- 高载荷变量:
|
||
RRR (0.819), tR (0.512)
|
||
- 物理意义:
|
||
直接反映降水量(RRR)和降水时间(tR)。
|
||
6) 交叉载荷与特殊变量
|
||
- O3(臭氧):在Factor1和Factor3上均有载荷,可能需结合气象与化学机制进一步分析。
|
||
- VV(能见度):受Factor3(风速)和Factor2(颗粒物)共同影响,符合实际物理规律。
|
||
## XGBOOST模型解读
|
||
1. 该模型使用历史AQI数据,并进行周期性编码和滞后特征构建(3小时粒度的滞后特征(最多7天)),作为特征工程。
|
||
2. 每次预测均采用该时间点以前的真实数据,即每次预测均为单步预测。
|
||
3. 使用随机搜索法参数调优。
|
||
4. 评估指标:效果很好
|
||
- RMSE: 12.30
|
||
- R-squared: 0.92
|
||
- MAE: 7.87
|
||
5. 重要特征:观察图,AQI_lag_1,2,3最为重要,即该时刻的AQI主要由前3个观测时刻决定。day_of_week显示影响较小,但不是完全没有。
|
||
6. 其实也做了利用递归直接预测一整个月的, |