2025-03-24 15:50:18 +08:00
2025-03-24 09:57:14 +08:00
2025-03-24 15:48:00 +08:00
2025-03-24 15:20:18 +08:00
2025-03-24 15:48:00 +08:00
2025-03-24 09:57:14 +08:00
2025-03-24 15:19:11 +08:00
2025-03-24 15:48:00 +08:00
2025-03-24 09:57:14 +08:00
2025-03-24 09:57:14 +08:00
2025-03-24 09:57:14 +08:00

题目1

结果分析:

折线图

从图中标准化后的空气质量指标小时均值变化趋势可见,各指标在 24 小时时间维度上呈现一定周期性特征: 各指标在每日相同时段表现出规律性波动,如部分指标于特定小时(如 19—23 时)出现标准化值峰值,在其他小时(如 4—5 时)形成谷值,且 “波峰 — 波谷” 的波动模式在每日 24 小时周期内稳定重复。这种以自然日为单位、在相同日时段内可重复的规律性变化,一定程度上体现了空气质量指标小时均值以 24 小时为周期的周期性特征,反映出其变化遵循固定时间循环规律。

ACF图

  1. 在 O3 ACF 图中,自相关系数呈现规律性波动:滞后 24 小时、48 小时、72 小时处多次显著超出置信区间(阴影区域),形成明显峰值,且峰值间隔固定为 24 小时。这直接表明 O3 指标的小时均值变化存在 24 小时周期性,即数据以自然日为周期循环波动,符合 “日周期” 特征。

  2. NO2 ACF 图中,自相关系数出现一定起伏波动,尤其在滞后 12 小时、24 小时等间隔处,呈现相对规律的波动趋势。尽管规律性弱于 O3仍暗示 NO2 指标可能存在周期性,需结合其他分析进一步验证。

  3. AQI、PM2.5、PM10、CO、SO2 的 ACF 图中,自相关系数随滞后小时数增加逐渐衰减,未出现如 O3 般规律的周期性峰值,也无固定间隔的显著波动,说明这些指标在 72 小时滞后范围内,周期性特征不明显。

题目2

热力图解读

热力图显示了各指标之间的相关性。颜色越深表示相关性越强,颜色越浅表示相关性越弱,偏红色表示正相关,偏蓝色表示负相关。

  1. 图形大致可分为四个部分:
    • 左上角的颜色较深的矩形反映了AQI与数个观测指标污染物的关系。
    • 右上侧有一些颜色较深的区块可能反映了污染物如CO、NO2、O3浓度与环境因素如温度、湿度、风速的相关关系。
    • 中心与中心正右侧的深色区块反映温度与气压间的强负相关关系。
    • 右下角的颜色较深的矩形主要反映各环境指标间的相关关系。
  2. 空气质量指数AQI与PM2.5、PM10有很强正相关关系与CO、NO2、SO2呈现较强正相关关系。同时跟VV水平能见度有较强负相关关系。后者的原因显然。经过查阅资料前者数个指标本就为AQI的计算所考虑的指标而同为考虑指标的O3相关性低不知道为什么需要进一步调研。
  3. 小时hour)与O3等指标呈现一定正相关关系这或许反映O3浓度变化具有日周期。且与U地面高度2米处的相对湿度等指标呈现一定负相关关系。

主成分分析解读

  1. 检验指标:
    • KMO值: 0.762>0.7。
    • 巴赫利特检验卡方值: 90424.712, p值: 0.0,显著。
    • 提取5个特征值大于1的因子作为主成分累积方差贡献率为78.89%。
    • 检验效果较好,说明数据适合主成分分析降维。
  2. 旋转载荷矩阵解读:
    1. Factor1温度气压因子
      • 高载荷变量: Tn (-0.963), T (-0.958), Tx (-0.954), P (0.924), Po (0.921), Td (-0.898)
      • 物理意义: 主要反映温度T, Tn, Tx和气压P, Po相关指标的强负相关关系温度越高气压越低
    2. Factor2颗粒物污染因子
      • 高载荷变量: AQI (0.967), PM10 (0.933), PM2.5 (0.879)
      • 物理意义: 直接反映空气质量指数AQI和颗粒物污染PM10, PM2.5),空气质量问题代表颗粒物污染主导。
    3. Factor3大气条件与污染物因子
      • 高载荷变量: U (-0.824), Ff (0.772), NO2 (-0.728), CO (-0.695), VV (0.667)
      • 物理意义: 风速增加Ff与相对湿度U负相关与能见度VV正相关。 同时风速增加Ff与污染物浓度NO2、CO负载荷的负相关关系可能暗示了风对大气污染物的扩散作用。
    4. Factor4因子
      • 高载荷变量: Pa (-0.747), SO2 (0.694)
      • 物理意义:难以解释。
    5. Factor5降水因子
      • 高载荷变量: RRR (0.819), tR (0.512)
      • 物理意义: 直接反映降水量RRR和降水时间tR
    6. 交叉载荷与特殊变量
      • O3臭氧在Factor1和Factor3上均有载荷可能需结合气象与化学机制进一步分析。
      • VV能见度受Factor3风速和Factor2颗粒物共同影响符合实际物理规律。

题目3

SARIMA模型解读

XGBOOST模型解读

  1. 该模型使用历史AQI数据并进行周期性编码和滞后特征构建3小时粒度的滞后特征最多7天作为特征工程。
  2. 每次预测均采用该时间点以前的真实数据,即每次预测均为单步预测。
  3. 使用随机搜索法参数调优。
  4. 评估指标:效果很好
    • RMSE: 12.30
    • R-squared: 0.92
    • MAE: 7.87
  5. 重要特征观察图AQI_lag_1,2,3最为重要即该时刻的AQI主要由前3个观测时刻决定。day_of_week显示影响较小但不是完全没有。
  6. 其实也做了利用递归直接预测一整个月的,效果看图就很明了了图
Description
No description provided
Readme 34 MiB
Languages
Jupyter Notebook 99.8%
Python 0.2%