我們正處在一個信息變革的時代。數(shù)據(jù),作為推動這場巨大變革的原材料,不是在地表之下經(jīng)過千百萬年形成并被發(fā)現(xiàn)的,而是通過傳感器和其他數(shù)據(jù)采集設(shè)備源源不斷地收集起來的。例如,NASA的對地觀測系統(tǒng)(earth observing system,EOS) 每天都要產(chǎn)生1TB的數(shù)據(jù)。
衛(wèi)星圖像是空間數(shù)據(jù)的典型例子。為了從衛(wèi)星圖像中提取信息,數(shù)據(jù)處理必須在一個空間參考框架下進行,這個空間參考框架可以是地球表面。然而,衛(wèi)星并不是空間數(shù)據(jù)的唯一來源,地球表面也不是可參照的唯一框架。一塊芯片也常常作為—種參照框架。在醫(yī)療成像中,人體就可以視為空間參照框架。事實上,連一筆超市交易都可以作為空間數(shù)據(jù)的例子,只要這筆交易包含了諸如郵政編碼這樣的信息。對空間數(shù)據(jù)的査詢或者命令稱為空間査詢。例如,“列出擁有超過萬種圖書的書店名稱”是一個非空間査詢,而“列出明尼阿波利斯市方圓10英里以內(nèi)的書店的名字” 則是一個空間査詢。
當(dāng)前,數(shù)據(jù)通過數(shù)據(jù)庫管理系統(tǒng)(database management system,DBMS) 進行存儲和管理。數(shù)據(jù)庫及其管理軟件是信息時代的成功案例,它們已漸漸滲透到我們?nèi)粘I畹母鱾€方面。如果沒有它們,現(xiàn)代社會將會止步不前。然而,盡管它們?nèi)〉昧肆钊瞬毮康某晒Γ珮I(yè)內(nèi)專業(yè)人士普遍認為,大部分現(xiàn)有的DBMS無法管理空間數(shù)據(jù),或者在管理空間數(shù)據(jù)的時候難以使用。為什么會這樣呢?DBMS通常是作為存放商業(yè)和財會數(shù)據(jù)的簡單而有效的倉庫。關(guān)于雇員、供應(yīng)商、顧客和產(chǎn)品的信息可以利用DBMS 安全地進行存儲并有效地進行檢索。可能的査詢 *** 是十分有限的,數(shù)據(jù)庫則為了高效地回答這些査詢而進行組織。因此,可以順利地將DBMS從商務(wù)領(lǐng)域移植到 *** 機構(gòu)和學(xué)術(shù)管理部門。
駐存在這些龐大數(shù)據(jù)庫中的數(shù)據(jù)比較簡單,通常包括數(shù)字、姓名、地址、產(chǎn)品描述等信息。這些DBMS能勝任那類為其量身設(shè)計的任務(wù)。比如,像“就銷售額而言,列出1998年前十位顧客”這樣的一個査詢,DBMS可以很快回答出來,即使它需要掃描一個很大的顧客數(shù)據(jù)庫也是如此。這樣的命令通常稱為“査詢”,雖然它們不是某種“詢問”。數(shù)據(jù)庫無需掃描所有的顧客,它會利用索引來縮小搜索范圍,就像我們查閱圖書時所做的那樣。而另一方面,“列出居住在離公司總部50英里以內(nèi)的顧客” 這樣一個相對簡單的查詢則會難住數(shù)據(jù)庫。要處理這個查詢,數(shù)據(jù)庫就必須把公司總部和頸客的地址 變換到一個能夠計算和比較距離的適當(dāng)參照系統(tǒng)中,可能是經(jīng)緯度坐標(biāo)系。然后,數(shù)據(jù)庫掃描整個顧客列表,計算顧客住所和公司之間的距離。如果距離小于50公里,保存該顧客的名字。這個過程無法利用索引來縮小 因為傳統(tǒng)的索引無法處理多維坐標(biāo)數(shù)據(jù)的排序問題。這樣,一條簡單、合理的業(yè)務(wù)査詢就會將DBMS置于無望的尷尬境地。因此,迫切需要能處理空間數(shù)據(jù)和空間査詢的數(shù)據(jù)庫。
添加微信好友, 獲取更多信息
復(fù)制微信號
來源:開源地理空間基金會中文分會
來源鏈接:https://www.osgeo.cn/post/1de92
本站聲明:網(wǎng)站內(nèi)容來源于 *** ,如有侵權(quán),請聯(lián)系我們,我們將及時處理。