探秘「氣象大資料」

2021-09-23 09:29:02 字數 3993 閱讀 9071

實況資料是氣象學科發展的最基礎資料,也是模式資料產生的源頭。如果沒有實況資料,計算機在運算「模式資料」時就少了初始值,即使是回歸到沒有計算機的人工預報時代,少了實況資料也無法進行天氣預報。

有人說,在「大資料時代」這個概念出現前,最名副其實的大資料應該數氣象資料。氣象資料一貫以龐雜眾多資料量大而著稱,但無論氣象資料多麼複雜,總體可以分為兩類:一類資料被稱為「實況資料」,一類被稱為「模式資料」。

簡單來說,實況資料屬於「一般過去時資料」,來自不同的觀測裝置。採集實況資料的氣象站點遍布全球,觀測範圍從幾千公尺的高空到地面,觀測手段從高科技的雷達衛星到最原始的人工觀測,這些資料的採集都是為了更真實地反映出地球外圍大氣圈的運動變化,而這些寶貴的資料也可以稱之為天氣預報之源。

模式資料與實況資料相比,可以說更簡單也可以說更複雜。簡單的是,這類資料僅由各類計算機的程式運算生成,屬於**未來的「一般將來時資料」;說它複雜則是因為計算量非常龐大,運用到的計算公式也異常複雜,為了更真實地模擬全球大氣的走向,運算出的資料量也是十分驚人的!

下面,我們就一一來詳細揭秘這兩類「氣象大資料」。

天氣預報之源——實況資料

實況資料是氣象學科發展的最基礎資料,也是模式資料產生的源頭。如果沒有實況資料,計算機在運算「模式資料」時就少了初始值,即使是回歸到沒有計算機的人工預報時代,少了實況資料也無法進行天氣預報。

那麼,實況資料是如何採集的呢?

很多年前,實況資料的採集和傳輸工作大部分都要靠人力完成。氣象觀測員每天要定時記錄百葉箱內的溫度、濕度等,並通過打**、發電報等方式將全國觀測資料進行彙總。到今天為止,仍有很多發展中國家採用這種採集傳輸方式。

而隨著科技的發展,在計算機、電子和通訊技術高度發達的今天,實況資料的採集和傳輸技術也有了天翻地覆的變化。所有實況資料的採集和傳輸幾乎都可以通過自動化完成,僅有少數幾個專案需要人工參與,比如地面能見度觀測、施放探空氣球、衛星軌道控制等。

目前,在氣象觀測站中溫度、濕度、氣壓、風向、風速等物理量均由電子控制的機械裝置完成,這些觀測站配有嵌入式晶元,晶元上有乙個精確的時鐘,可以準時地週期性工作,例如在整點每隔5分鐘、10分鐘或1小時自動採集周圍的環境資料,並自動將採集的氣象資料編碼為二進位制資料流,傳送到資料庫中。截至2023年年底,我國大約有50000多個這樣的地面觀測站,所有觀測站均為自動站。

由氣象觀測站觀測到的資料資訊會首先在各省的氣象台進行彙總,然後通過「質量控制」的環節,去掉或訂正某些由於觀測裝置故障造成的錯誤資料,質量控制過程同樣也是由電腦程式自動實現的。完成初步的質量控制後,各省就利用ftp檔案傳輸的方式,將該省該時刻全部觀測站點全部物理量資料打包為乙個大檔案,上傳到位於北京的國家氣象資訊中心的通訊臺。

世界其他國家的觀測資料的採集和傳輸也基本大同小異。除此以外,國與國之間也要進行實況資料的交換,而且必須是無償交換。這是因為大氣的運動是全球性的,僅僅依靠本國的實況資料無法做出準確的天氣預報,因此,世界氣象組織規定各國之間必須無償提供氣象觀測資料。不過,有的時候出於資訊保護或軍事安全的考慮,並不會對外廣播全部的觀測站點資料。那麼,每個國家需要義務提供多少站點資訊,又以什麼標準交換,都交換哪些觀測專案,這些都由世界氣象組織(wmo)制定和協調。

氣象大資料之魂——模式資料

模式資料是由高效能計算機根據當前天氣實況資料(包括地面、高空、衛星等)通過物理方程計算得出的。可以簡單形象地認為,有這樣一套龐大的計算天氣預報的程式,輸入當前已知的天氣現象,就可以輸出未來還沒有發生的天氣現象。計算出的天氣預報結果通常以規則的等經緯度網格來表示,網格上的每乙個點代表這個經緯度上未來某時刻某個物理量(比如溫度)的數值。這就是現代天氣預報業務的基礎叫「數值模式預報」,而這個龐大的電腦程式就被稱作「模式系統」。

所有的發達國家都有自己的一套用來演算天氣情況的模式系統,有的國家甚至還具有不止一套的系統。模式系統一般每天計算2~4次,通常在整點開始,利用整點前採集到的實況資料進行計算,每次計算要生成大概幾百個物理量,包括從開始計算的時刻(又稱作「起報時刻」)至未來240小時時效(或更長)的一系列二進位制網格資料,預報時效通常間隔3小時。目前氣象網格經緯度間距一般在0.25度數量級,乙個網格檔案大小通常在1~2兆,包含幾十萬個浮點數值。

當模式的預報時效越長,時效間隔越密,網格點間距越小,網格點數值和未來實況差異越小,就證明該模式系統效能越好,該國氣象水平越發達。由於模式**的物理量多,每天還要多次起報,預報時效密集,模式種類繁多,模式資料必須至少儲存一星期等要求,因此,在氣象資料中,無論從資料個數還是資料儲存量來說,模式資料是比重最大的「大資料」。

和實況資料不同的是,具備模式系統的國家通常沒有義務向其他國家無償提供本國的模式資料,或者最多無償提供經過抽稀處理的粗粒度模式資料。想要得到發達國家的高質量模式資料,必須通過購買才可以。例如想要得到歐洲中心的0.125度細網格模式資料,無論中國氣象局還是美國氣象局都必須向歐洲中心支付高昂的年費,才能每天獲得高質量的歐洲中心模式資料。

需要注意的是,這裡購買的僅僅是模式系統最終的「輸出」資料,而不是模式系統本身。因為模式系統水平的好壞代表了乙個國家氣象的硬實力,模式系統的源**(通常是大量的fortran程式)更是頂級領域技術機密,屬於非賣品。

跨國模式資料也是利用ftp等方式進行傳輸,傳輸的格式一般是採用世界氣象組織制定的一種稱作grib編碼的檔案規範,這種檔案比較適合描述模式資料。

氣象資料如何傳輸

看完「實況資料」和「模式資料」的介紹,有沒有覺得氣象資料量大浩如煙海,這麼多的資料都要一一傳送到預報員手裡,又需要多長時間呢?一般來說,地面、高空、雷達觀測資料的採集和傳輸過程較快,從資料採集到視覺化向預報員展示,通常幾分鐘時間就可以完成。也就是說,如果某地出現降雨天氣,只要儀器能觀測到,幾分鐘後位於氣象台的預報員就會知道。

相對而言,靜止氣象衛星觀測的時間稍長,中國的風雲衛星一般需要20多分鐘才能完成全球掃瞄,大概半小時後,預報員才能在電腦上看到衛星雲圖。

這裡面模式資料傳輸最慢。以上午08時起報的歐洲中心模式系統為例,首先計算未來3小時(上午11時)的所有物理量,打包為1個grib檔案並向其他國家傳輸,然後再計算未來6小時的資料,打包傳輸,直到最後完成10天後上午08時的預報資料計算並傳輸,每個預報時效的grib檔案大概100多兆,計算乙個預報時效大概需要幾分鐘時間,模式系統啟動也需要很長時間,這樣北京收到歐洲中心在早08時起報的第1個grib檔案大概要到下午1時45分,完成最後乙個240小時預報時效grib檔案的接收要到下午3時。這樣,如果要做早08時到下午3時的天氣預報,只能使用前1個起報時刻的模式資料,比如前一天晚20時的模式資料。

在我國,國家氣象資訊中心通訊臺承擔著資料傳輸和分發的樞紐作用。接收的資料報含來自各省的地面、高空、雷達資料、衛星資料、中國模式系統輸出結果的資料以及其他國家的觀測資料和模式資料。同時,還承擔資料的傳送功能,每天將各種觀測資料和模式資料通過地面網路或通訊衛星收發系統傳送給31個省市區氣象台和其他國家。

省一級的氣象台只負責將本省的觀測資料傳送至國家氣象資訊中心,不進行其他資料的傳送,同時接收來自國家氣象資訊中心分發的其他省的資料或各國模式系統資料。一般來說,由於國家到省級的網路傳輸需要較長時間,因此,國家級預報員在時間上將先於省級預報員檢視到最新的氣象資料。

預報員如何接收氣象資料

解釋完了資料是怎麼進行傳輸和接收的,最後乙個問題,乙個個資料又是如何出現在預報員的計算機中?這其實是一套先進、複雜的大資料處理系統。

資料到達通訊台後,首先兵分兩路,地面、高空站點實況報文資料被**至解報計算機,完成對於bufr編碼的解碼,提取出報文中的站號、物理量值等資訊,寫入乙個關係型資料庫中作為快取,然後通過每隔幾分鐘的定時作業,將同一觀測時刻全部站點的物理量資訊從關係型資料庫中提取出來,製作為乙個全國全部站點觀測檔案,寫入到乙個專供預報員客戶端軟體訪問的高速儲存伺服器中。

另外一路資料報括模式資料、衛星、雷達資料,這一類資料本身不是報文,不需要像站點實況資料那樣先拼接再寫入的過程,因此,通訊臺直接將這些資料傳送給高速解析伺服器,完成類似grib解碼、衛星通道拆分等操作,解碼後的結果一般是一些更小更多的檔案,直接寫入到和儲存全國站點觀測檔案相同的高速儲存伺服器中,供預報員客戶端軟體訪問。所有資料的解報、解碼時間一般幾秒鐘即可完成。

中國的預報客戶端稱作「micaps」(全稱氣象資訊綜合分析處理系統),主要功能是將高速儲存伺服器中的所有氣象資料進行視覺化展示,並提供便捷的瀏覽和互動操作,預報員利用顯示出來的模式資料和所有實況資料,結合自己的分析,在micaps上繪製出天氣預報的最終結果,最後將預報結果出圖和撰寫成文字傳送給發布部門,比如**、報紙、電視台等。

氣象大資料需求

國家氣象資訊中心 cimiss 系統於2008 年建設,隨著資料量和需求越來越多,已不能滿足業務需求,迫切需要氣象大資料管理平台來滿足新一代海量氣象資料儲存管理需求。需要接入cimiss的資料 利用前期資料處理標準化成果 資料資源標6大分體系,231項標準條目 構建新的資料處理流程。與各資料接入單位...

大資料和氣象的「聯姻」

我們每天都在看天氣預報,大家會發現天氣預報基本準確,但也有那麼幾天不靠譜。近年來,隨著技術水平的提公升,人們對氣象服務水平的需求越來越高,因此氣象的精準預報成為氣象部門追求的目標。氣象的精準預報需要行業內外的結合,而創新可能在行業之外,比如引入新思想和新方法。中國科學院自動化研究所研究員張文生告訴 ...

深圳活用大資料提公升氣象服務

對流層風廓線儀實時監測採集氣象資料。市氣象局預報員密切監測跟蹤天氣動態。氣象大資料時代來了,並成為一股勢不可擋的潮流。颳風下雨 高溫寒冷 電閃雷鳴 日常中獲取的各種氣象服務資訊都來自於海量氣象大資料,深圳氣象人就是 資料分析師 通過採集分析繁雜的氣象資料不斷提供氣象服務。在這科技發展的時代,龐雜眾多...