
大數(shù)據(jù)可視分析在海洋領(lǐng)域的應(yīng)用
17頁大數(shù)據(jù)可視分析在海洋領(lǐng)域的應(yīng)用Application of big data visual analysis in the marine field摘要隨著海洋觀測(cè)技術(shù)和數(shù)值仿真技術(shù)的發(fā)展,人們能獲取到規(guī)模更大、分辨率更高的海洋數(shù)據(jù),這為復(fù)雜多元海洋環(huán)境要素及結(jié)構(gòu)現(xiàn)象的分析帶來了機(jī)遇,同時(shí)也給傳統(tǒng)的分析方法帶來了挑戰(zhàn)因此,將大數(shù)據(jù)可視分析方法引入了海洋數(shù)據(jù)分析,并探索了其在多元海洋時(shí)空數(shù)據(jù)分析、海洋重要結(jié)構(gòu)的時(shí)空特征和演化分析等方面的應(yīng)用價(jià)值,開發(fā)了多個(gè)可視分析系統(tǒng),并通過全球和我國周邊一些海域數(shù)據(jù)分析的案例研究,提出了海洋數(shù)據(jù)可視分析的基本框架,展示了可視分析是大數(shù)據(jù)時(shí)代海洋復(fù)雜數(shù)據(jù)分析方面一種很有前途的技術(shù)關(guān)鍵詞:?可視分析?;?多元海洋時(shí)空數(shù)據(jù)?;?海洋結(jié)構(gòu)?;?可視分析應(yīng)用AbstractWith the development of ocean observation technology and numerical simulation technology, larger scale and higher resolution ocean data can be obtained, which brings opportunities for the analysis of complex ocean environmental elements and structures, and also brings great challenges to traditional analysis methods.For this reason, the method of big data visual analysis was introduced and its application value in the analysis of multivariate ocean spatiotemporal data, the spatiotemporal characteristics and evolution analysis of important ocean structures was explored.Some visual analysis systems were developed and the basic framework of visual analysis of ocean data through case studies of data analysis of some sea areas around the world and China was summarized, showing that visual analysis is a promising technology for ocean complex data analysis in the era of big data.Keywords:?visual analysis?;?multiple ocean temporal and spatial data?;?ocean structure?;?visual analysis application1 引言隨著海洋觀測(cè)技術(shù)和數(shù)值仿真技術(shù)的不斷進(jìn)步,人們逐漸可以獲取到更高分辨率和更大規(guī)模的多元時(shí)空變化的數(shù)據(jù)集,這給針對(duì)海洋復(fù)雜過程的分析研究提供了更多的機(jī)會(huì),也帶來了很大的挑戰(zhàn)。
首先,海洋數(shù)據(jù)本身隱含著復(fù)雜的時(shí)空過程和多元要素的動(dòng)態(tài)變化,多個(gè)時(shí)空變量在空間和時(shí)間上與多個(gè)尺度高度相關(guān),這使得從這些龐雜的數(shù)據(jù)中獲取有價(jià)值的模式或發(fā)現(xiàn)海洋結(jié)構(gòu)(現(xiàn)象)及其時(shí)空演化規(guī)律變得困難;同時(shí)大數(shù)據(jù)使得傳統(tǒng)的依賴人工發(fā)現(xiàn)、評(píng)估和解釋時(shí)空模式或特征的分析方法變得低效;另外對(duì)海洋結(jié)構(gòu)及其時(shí)空模式的識(shí)別目前還是局部粒度的,缺少對(duì)其時(shí)空模式的整體概覽和多尺度細(xì)致的分析,而且目前的分析系統(tǒng)也缺少符合海洋研究者探索不同海洋時(shí)空情形的高效交互方式;此外,海量海洋大數(shù)據(jù)導(dǎo)致存儲(chǔ)困難、計(jì)算時(shí)間過長,雖然采用常規(guī)的數(shù)據(jù)約簡技術(shù)可以降低數(shù)據(jù)規(guī)模,但同時(shí)容易引起數(shù)據(jù)細(xì)節(jié)甚至關(guān)鍵結(jié)構(gòu)信息的丟失;高緯度的海洋多元要素間的關(guān)系分析也變得復(fù)雜和困難;傳統(tǒng)的2D/3D可視化方法難以應(yīng)對(duì)海量高維復(fù)雜時(shí)空數(shù)據(jù)的挑戰(zhàn),視覺混淆和過度繪制問題變得尤為突出可視分析是結(jié)合了機(jī)器學(xué)習(xí)、統(tǒng)計(jì)等自動(dòng)化數(shù)據(jù)分析算法和交互式可視化來促進(jìn)數(shù)據(jù)分析和推理的科學(xué)[1],能從大規(guī)模和復(fù)雜數(shù)據(jù)中多尺度地提取有用的信息和有意義的知識(shí)[2],并通過交互可視化數(shù)據(jù)探索生成假設(shè)和驗(yàn)證,以獲得對(duì)物理現(xiàn)象的科學(xué)洞察,因而可視分析是現(xiàn)有的基于經(jīng)驗(yàn)、理論和基于數(shù)值模式方法進(jìn)行復(fù)雜海洋數(shù)據(jù)分析研究的有力補(bǔ)充。
為此,筆者將先進(jìn)的可視分析技術(shù)引入復(fù)雜海洋數(shù)據(jù)分析中,開發(fā)了多個(gè)可視分析系統(tǒng),用于輔助領(lǐng)域?qū)<姨剿鞫嘣Q蟓h(huán)境要素的時(shí)空特征或相關(guān)性,分析渦旋及海洋鋒等重要海洋結(jié)構(gòu)(現(xiàn)象)的時(shí)空特征及其演化規(guī)律,呈現(xiàn)可視分析技術(shù)在海洋數(shù)據(jù)分析領(lǐng)域的應(yīng)用前景,并總結(jié)了海洋數(shù)據(jù)可視分析的基本框架2 相關(guān)工作2.1 多元海洋時(shí)空數(shù)據(jù)可視分析常見的多元海洋時(shí)空數(shù)據(jù)可視分析是圍繞研究一個(gè)或多個(gè)海洋標(biāo)量(溫度、鹽度等)和矢量(流場(chǎng))的變化特征展開的,例如,Stein R J等人[3]提出了一個(gè)用于水質(zhì)研究的交互式可視分析系統(tǒng),該系統(tǒng)利用剖面、等值面、輪廓面、矢量箭頭等方法,對(duì)水源鹽度和流場(chǎng)數(shù)據(jù)的時(shí)空特征進(jìn)行多視圖協(xié)同交互分析Su T Y等人[4]開發(fā)了海洋數(shù)據(jù)可視分析系統(tǒng),它支持對(duì)等高線、等值面、體繪制和流場(chǎng)的動(dòng)態(tài)模擬,該集成系統(tǒng)采用基于圖形處理器(graphics processing unit,GPU)的渲染方法加速標(biāo)量或矢量場(chǎng)的繪制,直觀地分析海量海洋水文環(huán)境要素的空間特征,提升了數(shù)據(jù)分析時(shí)交互的速度由于海洋數(shù)據(jù)是由多個(gè)相互關(guān)聯(lián)的變量組成的多場(chǎng)數(shù)據(jù)集,出現(xiàn)了一些基于平行坐標(biāo)分析多變量關(guān)系的可視分析系統(tǒng)例如,Guo H Q等人[5]提出了一種針對(duì)多變量體數(shù)據(jù)的可視分析系統(tǒng),利用平行坐標(biāo)圖和基于多維比例尺圖對(duì)多變量體數(shù)據(jù)進(jìn)行可視化和交互分析,實(shí)驗(yàn)證明,該系統(tǒng)對(duì)不同大小和不同屬性的數(shù)據(jù)集的可視分析具有較高的可擴(kuò)展性。
Yano M等人[6]提出了一個(gè)三維可視化系統(tǒng),利用平行坐標(biāo)圖對(duì)全球多個(gè)模態(tài)水域的多元屬性(溫度、密度和鹽度)進(jìn)行對(duì)比分析,以發(fā)現(xiàn)模態(tài)相似的水域Rocha A等人[7]提出了一個(gè)用于分析仿真模型中多個(gè)海洋標(biāo)量、矢量間相關(guān)性的可視分析系統(tǒng),以不同的可視化形式同時(shí)疊加多個(gè)變量的可視化顯示,支持靈活的用戶交互和多變量切換顯示,以滿足用戶多層次的分析需求但基于平行坐標(biāo)的可視分析系統(tǒng)存在線條重疊和視覺混亂的問題,因此又出現(xiàn)了一些帶有聚合功能的平行坐標(biāo)圖的新設(shè)計(jì)總之,相比傳統(tǒng)的可視化分析方法,多元時(shí)空數(shù)據(jù)可視分析系統(tǒng)提供了更多的交互探索和可視化新設(shè)計(jì),可在不同程度上提升數(shù)據(jù)分析的質(zhì)量和效率2.2 海洋結(jié)構(gòu)(現(xiàn)象)的可視分析大規(guī)模海洋數(shù)據(jù)中隱含著與復(fù)雜海洋過程相關(guān)的多種結(jié)構(gòu)或現(xiàn)象,這里筆者主要以海洋鋒和渦旋等重要海洋結(jié)構(gòu)識(shí)別與檢測(cè)、時(shí)空特征分析和演化兩個(gè)方面介紹相關(guān)可視分析系統(tǒng)2.2.1 海洋結(jié)構(gòu)(現(xiàn)象)的識(shí)別與檢測(cè)在海洋中,各種現(xiàn)象/結(jié)構(gòu)時(shí)時(shí)刻刻都會(huì)發(fā)生變化,并且每種現(xiàn)象都有其自身的物理特征,因此產(chǎn)生了多種特有結(jié)構(gòu)的檢測(cè)和分析方法海洋鋒的檢測(cè)方法主要有梯度法、直方圖法 、熵方法、Canny邊緣算子方法[8]等。
常用的渦旋檢測(cè)方法有3種[9]:第一種是基于幾何的方法,該方法利用流場(chǎng)中流線的幾何形狀確定渦旋;第二種是基于閾值的方法,代表性的閾值法是基于Okubo-Weiss參數(shù)檢測(cè)渦旋;第三種是結(jié)合幾何法與閾值法的混合檢測(cè)方法,該方法可以提高渦流檢測(cè)的準(zhǔn)確性和從海平面高度異常識(shí)別渦旋多核結(jié)構(gòu)的能力此外,通過Okubo-We iss參數(shù)閾值法識(shí)別渦旋,并將其作為訓(xùn)練集,然后通過卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)進(jìn)行特征學(xué)習(xí),可實(shí)現(xiàn)基于深度學(xué)習(xí)的渦旋檢測(cè)[10]2.2.2 海洋結(jié)構(gòu)(現(xiàn)象)的時(shí)空特征和演化由于海洋數(shù)據(jù)規(guī)模變大,海洋結(jié)構(gòu)(現(xiàn)象)通常涉及多個(gè)變量在空間、時(shí)間和多個(gè)尺度上的變化,這加大了海洋結(jié)構(gòu)(現(xiàn)象)時(shí)空特征及演化分析的難度Matsuoka D等人[9]提出了一種渦旋檢測(cè)、跟蹤、事件檢測(cè)和可視化的新方法,分析渦旋演化過程中的合并和分叉,以及渦旋和洋流之間的相互作用等事件Woodring J等人[11]開發(fā)了一個(gè)全球海洋渦旋系統(tǒng),利用折線圖、直方圖等常見的圖表對(duì)渦旋的大小、深度進(jìn)行可視化,還利用大量的高分辨率時(shí)空建模數(shù)據(jù)對(duì)渦旋進(jìn)行多尺度的空間探索分析。
可視分析技術(shù)確實(shí)在時(shí)空模式發(fā)現(xiàn)和演化分析的效率和質(zhì)量方面有顯著的促進(jìn)作用,但是在海洋領(lǐng)域應(yīng)用可視分析技術(shù)的研究目前還處于起步階段,如何應(yīng)用可視分析技術(shù)更好地提升復(fù)雜海洋數(shù)據(jù)分析的能力,值得進(jìn)一步探索和研究3 海洋領(lǐng)域的可視分析技術(shù)3.1 海洋數(shù)據(jù)及預(yù)處理通常,海洋數(shù)據(jù)來自觀測(cè)設(shè)備(如衛(wèi)星、船舶或傳感器等),或來自計(jì)算機(jī)仿真(如海洋大氣模型)海洋和大氣在循環(huán)系統(tǒng)中相互耦合,因此這里的海洋數(shù)據(jù)主要指各種海洋環(huán)境要素,包括海洋水文數(shù)據(jù)和海洋氣象數(shù)據(jù)海洋水文數(shù)據(jù)包含水深、水溫、鹽度、水流、波浪、水色、透明度、海冰和海洋光等海洋氣象數(shù)據(jù)包含氣溫、壓力、濕度、風(fēng)速、降水、云、霧等[12]單個(gè)時(shí)間步長的觀測(cè)數(shù)據(jù)和模擬數(shù)據(jù)全部由空間場(chǎng)數(shù)據(jù)組成,該空間場(chǎng)數(shù)據(jù)的每個(gè)網(wǎng)格點(diǎn)處都由多個(gè)變量組成因此,各種時(shí)間序列的空間場(chǎng)數(shù) 據(jù)構(gòu)成了海洋數(shù)據(jù)集(觀測(cè)數(shù)據(jù)集或仿真集)隨著觀測(cè)技術(shù)和計(jì)算機(jī)模擬技術(shù)的不斷發(fā)展,海洋數(shù)據(jù)的獲取量正在以不可預(yù)測(cè)的速度迅速增長同時(shí),海洋數(shù)據(jù)包含強(qiáng)大的時(shí)空過程,涉及多尺度結(jié)構(gòu)之間的復(fù)雜相互作用海洋數(shù)據(jù)具有異構(gòu)性高、維度高、體積大、時(shí)空變化大以及多種海洋數(shù)據(jù)屬性之間耦合相關(guān)的 特點(diǎn)因此,在收集到海洋數(shù)據(jù)后,首先要進(jìn)行數(shù)據(jù)清洗,以消除重復(fù)性數(shù)據(jù)、缺失數(shù)據(jù)等;其次要進(jìn)行數(shù)據(jù)精簡,例如過濾/采樣(如簡單隨機(jī)采樣、等距抽樣、分層抽樣等)、降維、分組聚合和模型擬合等[12,13]。
3.2 海洋領(lǐng)域的可視分析技術(shù)3.2.1 海洋領(lǐng)域常用的可視化方法海洋領(lǐng)域的可視分析系統(tǒng)通常采用科學(xué)可視化技術(shù),信息可視化技術(shù)用得較少,但信息可視化技術(shù)在以挖掘信息和獲取知識(shí)為目標(biāo)的大數(shù)據(jù)分析中尤為重要[1]早期,多維海洋環(huán)境要素(如水溫、鹽度等標(biāo)量和流場(chǎng)矢量)可視化的常用方法是使用二維點(diǎn)、線、面、粒子、標(biāo)記符和3D體進(jìn)行繪制對(duì)于空間數(shù)據(jù)可視化,2D地圖或基于地球上的投影展示通常是地理分布的首選,同時(shí)還需要考慮投影、比例尺和視覺編碼設(shè)置;對(duì)于時(shí)間序列數(shù)據(jù)可視化,通常用時(shí)間序列圖展示海洋變量或現(xiàn)象的變化趨勢(shì)當(dāng)對(duì)象的時(shí)空信息維度較高時(shí),三維展示也存在局限性,因此通常還需要結(jié)合高維數(shù)據(jù)可視化方法,如散點(diǎn)圖、熱圖/相關(guān)矩陣、投影、平行坐標(biāo)圖以及集成的平行坐標(biāo)散點(diǎn)圖等常用的可視化方式[13]但是在大數(shù)據(jù)環(huán)境下,平行坐標(biāo)圖會(huì)遇到線條密集、重疊 覆蓋的問題,根據(jù)線條的聚合特征可以對(duì)平行坐標(biāo)圖進(jìn)行簡化,減少視覺混淆[1]3.2.2 海洋領(lǐng)域常用的交互方法在大數(shù)據(jù)可視分析的界面中,還需要提供相應(yīng)的交互組件以及合適的交互方式來幫助用戶使用和管理分析過程目前,信息可視化中的人機(jī) 交互技術(shù)主要可以分為5類:動(dòng)態(tài)過濾技術(shù)、整體+詳細(xì)技術(shù)、平移+縮放技術(shù)、焦點(diǎn)+上下文技術(shù)、多視圖關(guān)聯(lián)協(xié)同技術(shù)[1]。
但對(duì)于一個(gè)具體的海洋領(lǐng)域可視分析系 統(tǒng)而言,往往需要依據(jù)其特定的分析任務(wù)和用戶習(xí)慣來設(shè)計(jì)更恰當(dāng)?shù)慕换シ绞匠S玫慕换シ绞接羞x擇、探索、抽象/具象、過濾、重配置、編碼、連接等選擇是海洋數(shù)據(jù)可視分析系統(tǒng)中最常見的交互技術(shù),允許用戶在很多顯示項(xiàng)目中標(biāo)記感興趣的特定項(xiàng)目,選擇這些項(xiàng)目并跟蹤它們;探索允許用戶通過更改視圖來查看無法在視口或顯示屏上可視化的項(xiàng)目;抽象/具象可以幫助用戶查。
