看大數(shù)據(jù)如何應(yīng)用于環(huán)境管理
大數(shù)據(jù)可以找出看似不相關(guān)數(shù)據(jù)的關(guān)聯(lián)性,實(shí)現(xiàn)不確定加不確定等于確定的效果,在大數(shù)據(jù)時(shí)代,這一確定性將不斷精確。下面看看大數(shù)據(jù)在環(huán)境領(lǐng)域的應(yīng)用會(huì)產(chǎn)生哪些“魔法”,是不是會(huì)令你腦洞大開?
■精細(xì)預(yù)測空氣質(zhì)量
以往,空氣質(zhì)量狀況只能通過空氣站點(diǎn)得知,一旦這個(gè)地方?jīng)]有建設(shè)空氣質(zhì)量監(jiān)測點(diǎn),就無法獲知具體的空氣質(zhì)量數(shù)值。而由于空氣質(zhì)量受多種因素的影響,每個(gè)區(qū)域的空氣質(zhì)量各不相同。就北京來說,六環(huán)內(nèi)的35個(gè)空氣質(zhì)量站點(diǎn)遠(yuǎn)遠(yuǎn)無法反映整個(gè)北京的空氣質(zhì)量狀況。但傳統(tǒng)空氣質(zhì)量監(jiān)測站點(diǎn)的建設(shè)需要投入大量的財(cái)力、物力和人力。
應(yīng)用大數(shù)據(jù)方法,微軟與環(huán)保部門合作研發(fā)的U-Air便可以分析和預(yù)測城市細(xì)粒度1km×1km范圍的空氣質(zhì)量。這主要通過融合兩類數(shù)據(jù)來實(shí)現(xiàn),第一類數(shù)據(jù)是空氣質(zhì)量監(jiān)測實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù),第二類數(shù)據(jù)是空氣質(zhì)量相關(guān)性數(shù)據(jù),包括氣象數(shù)據(jù)、交通數(shù)據(jù)、人流數(shù)據(jù)、道路結(jié)構(gòu)數(shù)據(jù)、興趣點(diǎn)。通過對這些數(shù)據(jù)建立模型,可以查看任意點(diǎn)位之前6小時(shí)的空氣質(zhì)量狀況,并預(yù)測6~12小時(shí)、12~24小時(shí)的空氣質(zhì)量狀況。
U-Air已在61個(gè)城市進(jìn)行驗(yàn)證,平均準(zhǔn)確度比傳統(tǒng)方法高出7個(gè)百分點(diǎn)。北京的準(zhǔn)確度可以達(dá)到75%,廣州和深圳可以達(dá)到80%。
從精度來說,目前U-Air可以實(shí)現(xiàn)1km×1km的細(xì)粒度的空氣質(zhì)量預(yù)測,未來,空氣細(xì)粒度將越來越細(xì)。
從計(jì)算速度來說,只要花費(fèi)幾秒鐘,U-Air就可以實(shí)現(xiàn)全市空氣質(zhì)量的預(yù)測。
由此,從準(zhǔn)確度、精度、速度來說,基于大數(shù)據(jù)研發(fā)的城市細(xì)粒度空氣質(zhì)量模型遠(yuǎn)遠(yuǎn)超越傳統(tǒng)空氣質(zhì)量模型。
■計(jì)算尾氣排放量
過去一個(gè)小時(shí),北京市路面上總油耗是多少?這些油耗將產(chǎn)生多少PM2.5和PM10?沒有大數(shù)據(jù)之前,這基本上無法回答。但在大數(shù)據(jù)看來,便是小菜一碟。
利用車輛的GPS軌跡,結(jié)合歷史數(shù)據(jù)、路網(wǎng)和天氣,可以計(jì)算路面速度,之后通過速度推算出流量,最后根據(jù)平均排量,算出總能耗和排放量。
就北京來說,通過對北京每一條道路過去10分鐘的車速、流量、排放進(jìn)行實(shí)時(shí)估計(jì),就可以通過機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘,計(jì)算出北京十幾萬條路在過去10分鐘的總排放量。
機(jī)動(dòng)車能耗狀況的掌握有利于優(yōu)化交通路線設(shè)計(jì),也可以幫助相關(guān)部門進(jìn)行決策,比如可以將單雙號限行具體到某一條路線或者某個(gè)區(qū)域。加入站點(diǎn)監(jiān)測數(shù)據(jù),還可以計(jì)算尾氣排放量在空氣質(zhì)量中的占比情況
■計(jì)算區(qū)域噪音指數(shù)
紐約長期被噪音污染困擾,但噪音具有實(shí)時(shí)性,并且不同人不同時(shí)間對噪音的感知不同,所以對噪音的監(jiān)管非常困難。
計(jì)算區(qū)域噪音指數(shù)需要解決3個(gè)問題,即紐約什么地方有噪音、什么樣的聲音算噪音以及這個(gè)地方為什么有噪音。如果用傳統(tǒng)添加硬件的方法進(jìn)行解決,整個(gè)紐約市至少需要一百多萬個(gè)噪音傳感器,顯然這并不可行,并且噪音傳感器只能反映分貝數(shù),無法與公眾感受結(jié)合起來。
鄭宇的大數(shù)據(jù)團(tuán)隊(duì)則注意到與噪音相關(guān)的周邊數(shù)據(jù)。紐約有一部311電話,用于市民投訴,這是公眾感受的重要數(shù)據(jù)源。于是,鄭宇團(tuán)隊(duì)對311的數(shù)據(jù)進(jìn)行了整合,對噪音投訴的時(shí)間、地點(diǎn)、類別、次數(shù)、性質(zhì)進(jìn)行了整理,通過與道路結(jié)構(gòu)、興趣點(diǎn)、人的社交媒體數(shù)據(jù)進(jìn)行融合,計(jì)算出每個(gè)區(qū)域每段時(shí)間噪音指數(shù),反映了公眾對噪音的整體感受情況。
紐約城市噪音模型可以回放24小時(shí)任何時(shí)間任何地點(diǎn)的噪音污染情況,并直接顯示噪音污染區(qū)域的排名情況。
使用微信“掃一掃”功能添加“谷騰環(huán)保網(wǎng)”