1960 - 2021 年全國氣象數據分享
本文所介紹的數據集發布于 科學數據銀行 ,由希臘帕特拉斯大學物理系大氣物理實驗室和中國科學院大氣物理研究所東亞區域氣候-環境重點實驗室合作完成,基于多重分析系列同化(MASH)和 CLIMATOL 方法,對 1960-2021 年間中國 366 個氣象站點的日平均溫度、最高溫度、最低溫度及降水數據進行了不一致性檢測、估計與調整,進而構建出同化后的日溫度和降水數據集。
1 數據介紹

在網站中提供了 RAR 格式的完整數據壓縮包,數據文件夾中包含由 366 個中國氣象站編號、經緯度的 Excel 文件,以及 RR、TG、TN 和 TX 四個文件夾。每個文件夾中都有 daily 和 monthly 兩個子文件夾,分別代表逐日、逐月降水量、平均溫度、最低溫度及最高溫度。每個子文件夾中都有 366 個以站號命名的 csv 文件,各 csv 文件均包含日期及對應數據記錄。
- 數據網站 DOI:10.57760/sciencedb.01731
- 對應論文 DOI:10.1007/s00376-022-2246-4
數據文獻引用格式詳見官方網站。
2 數據整理
2.1 氣象站信息表
原始氣象站信息 Excel 表中不包含各氣象站對應名稱信息,在中國氣象數據網中提供的 中國地面氣象站基本氣象要素觀測資料臺站表 的基礎上,使用道客巴巴網站中的 全國各氣象臺站區站號及經緯度 文檔進行補充,生成包含各氣象站對應名稱及所在省級行政區的表格文件,命名為 Station Information.xlsx。
各氣象站位置如下圖所示:

2.2 逐年氣象數據
在逐月氣象數據的基礎上,通過 Python 代碼程序對數據進行統計,得到逐年氣象數據,并使用與源數據類似的 csv 數據存儲格式將結果數據保存至對應的數據文件夾中。逐年數據文件夾命名為 annually。
以降水量為例,Python 代碼如下:
import os
import pandas as pd
# 源數據文件夾路徑,根據源數據保存位置自行調整
data_folder = "RR/monthly"
# 創建一個空的字典來存儲每個氣象站的逐年降水量數據
station_data = dict()
# 遍歷文件夾中的所有文件
for filename in os.listdir(data_folder):
# 檢查文件是否為 csv 文件
if filename.endswith(".csv"):
# 提取氣象站編碼,即源數據文件名的前五個字符
station_code = filename[:5]
# 讀取 csv 文件
file_path = os.path.join(data_folder, filename)
df = pd.read_csv(file_path)
# 確保日期格式正確
df["Date"] = pd.to_datetime(df["Date"], format="%Y-%m-%d")
# 將降水量數據按年份匯總
df["Year"] = df["Date"].dt.year
# 在 csv 數據表中,降水量數據列名為對應氣象站編碼
# 按年份對數據進行分組,計算逐年降水量
# 如需計算逐年氣溫則將 sum() 改為 mean() 即可
annually = df.groupby("Year")[station_code].sum().reset_index()
# 如果該氣象站的數據已經在字典中,則追加新的數據
if station_code in station_data:
station_data[station_code] = pd.concat(
[station_data[station_code], annually], ignore_index=True
)
else:
station_data[station_code] = annually
# 將每個氣象站的逐年降水量數據寫入單獨的 csv 文件
for station_code, data in station_data.items():
# 數據輸出文件夾,可根據需要自行調整
# 如果文件夾不存在,則自動創建該文件夾
if not os.path.exists("RR/annually"):
os.makedirs("RR/annually")
csv_path = f"RR/annually/{station_code}.csv"
data.to_csv(csv_path, index=False)
print(f"{station_code}.csv 數據導出完成!")
print("逐年降水量數據已全部導出至 csv 文件……")
3 數據分享
百度網盤:1960-2021年全國氣象數據.zip
- 鏈接: https://pan.baidu.com/s/1gyOwYHId1qPP_SAT2RA1Eg
- 提取碼: aug5
浙公網安備 33010602011771號