Choropleth地圖-數據分類指南?
等間距,分位數,自然斷裂,漂亮斷裂。每種數據分類 *** 生成不同的脊索面圖。我們解釋了使用每種choropleth地圖的優缺點。
如何利用數據分類制作Choropleth地圖?
你已經準備好了你的定量數據。鼠標懸停在“分類”上,等待生成多色的choropleth地圖。
但你不禁想知道你是否選擇了正確的數據分類模式。
Equal intervals 分位數,自然休息,漂亮休息-有很多選擇。但它們之間有什么區別呢?
添加微信好友, 獲取更多信息
復制微信號
這篇文章將幫助您了解存在**choropleth地圖**的類型,以及為您的地圖選擇哪一個。
選擇課程數量?
首先,必須基于多個類聚合數據。當你有更多的類,你會得到更多的變化,有時會使它更難分離陰影。如果你想測試不同的底紋, ColorBrewer 有顏色建議工具。
例如,這里是 10個班 :
而類越少,類之間的分離就越少,例如 5個等級 下面。
畢竟,您決定使用的類的數量實際上取決于映射的目的。
選擇數據分類 *** ?
其次,您必須決定如何對數據進行分類。換一種說法,數據分類用邊界來安排數據,以分離類。您可以使用相等的間隔模式來分隔類:
或者,您可以選擇一種分位數類型的分類器,它在其中以不同的方式排列數據(更多內容見下文)。
每種數據分類技術都會生成唯一的**choropleth圖**。但是它們都給地圖閱讀器描繪了一個不同的故事。你必須意識到的一件事是,您在每個Choropleth映射中使用的是**相同數據**,但是真正的變化是**如何對數據進行分類**。
我們的示例數據?
你必須認識到的最重要的一點是,對于我們創建的每一幅choropleth地圖,我們都使用**相同的數據**。改變的是我們如何對數據進行分類。
在本例中,我們計算國家名稱中的字母數。例如:
馬里、古巴、秘魯等國 四個字母的國家 .
然而,波斯尼亞和黑塞哥維那有22個字符。
如果您打印出4到22個字符,它將有很多顏色。
例如,四個字母的國家是最淺的綠色陰影。隨著字母數的增加,陰影會變暗。
按國家/地區字符數劃分的Choropleth地圖陰影
哪個國家屬于哪個集團?很難說。
所以這就是我們使用數據分類的原因。當我們按類分組時,陰影會減少,我們會按組聚合數據。
最后,問題是我們如何定義這些類邊界或容器?換句話說,我們如何 對數據進行分類 分組?
首先,讓我們嘗試將類劃分為等距分組,如下面的等距分組,看看會發生什么。
等間隔數據分類?
等距切割和干燥。它真正的作用是 將類分成相等的組。
1班 :4-8(113個國家有4、5、6、7或8個字母)
2班 :8–12(41)
3班 :12–16(12)
4級 :16–20(8)
第5類 :20–24(2)
這個 一個國家的最小字符數為4 比如秘魯。這個 最多24個字符 中非共和國。在地圖上繪制每個國家及其字符數時,如下所示(括號表示計數):
等間隔數據分類從最小值中減去更大值( 24-4=20 )在我們的示例中,我們生成了5個類,但類的數量完全取決于您。然后,它將20除以5,得到一個區間( 20/5=4 )
幾乎所有情況下,等間隔的脊索映射都會導致 每類國家的不平等計數 . 例如,1類有 113個國家 在176個國家中,有4、5、6和7個字母。
然而,只有2個國家有超過20個字母。因此,與只有2種帶有深色底紋的顏色相比,此地圖顯示的淺色底紋顏色更多。
但是如果你想讓每個班級的國家數接近相等,會發生什么呢?這時你應該使用分位數圖。
分位數(等計數)分類?
這個 分位數圖 嘗試在5個類中的每個類中存儲相同數量的功能。換句話說,分位數映射嘗試 將組排列成相同的數量 . 因此,陰影將在分位數類型的地圖中均勻分布。
1班 :4-6(56個國家有4、5或6個字母的名稱)
2班 :6–7(38)
3班 :7–8(19)
4級 :9–11(36)
第5類 :12–24(27)
分位數地圖占特征總數的176個國家。然后,它將總數除以類的數目得到平均值( 176/5=35.2 )最后,分位數映射計算每組中的數量,并盡可能接近平均值。
您可以看到每個類的計數看起來非常相似,并且 接近35.2 . 對于每個類,沒有太多或太少的可供計算。
盡管分位數合唱團地圖的平衡風格,他們也可能是誤導。它們是誤導性的,因為人們傾向于看一個陰影,把它歸為同一類。例如,一個12個字母的國家和一個24個字母的國家有相同的陰影……和 正義在哪里?
自然斷裂(Jenks)分類?
關于自然中斷(Jenks)分類要記住的之一件事是,它是針對Choropleth地圖的優化 *** 。簡而言之,它會排列每個分組,因此每個分組的 差異都較小類別 或陰影。
1班 :4–6(56)
2班 :6–8(57)
3班 :8–12(41)
4級 :12–18(18)
第5類 :18–24(4)
自然中斷(jenks)采用迭代 *** ,將類之間的平方偏差和與數組平均值進行比較。然后,該算法使用方差擬合優度,1為完全擬合,0為差擬合。
自然斷裂數據分類 *** 的創始人是一位名叫喬治·弗雷德里克·詹克斯的制圖員。他專門研究看著地圖時人眼的運動。這張地圖的結果看起來也很棒。
您可以看到這個數據分類 *** 最小化每組的變化 . 因為我們有許多較短的國家名稱,所以它會找到合適的類別范圍。但它仍然設法將具有較長國家名稱的離群值分組到自己的類中。
標準偏差分類?
標準差是一種統計技術類型的地圖,基于多少數據不同于平均值。測量數據的平均值和標準偏差。然后,每一個標準差變成一個等級 在choropleth地圖上。
在我們的例子中,字符的平均數約為8.5,標準偏差為3.7個字符。因此,所有5到8個字符的國家將被置于0到1的標準偏差分組中。同樣,具有9到12個字母的國家被歸為0到1個標準偏差范圍,如下所示:
1級 :
2級 :-1至0σ(104)
3級 :0至1σ(41)
4級 :1至2σ(10)
5級 :2至3σ(9)
6級 :3至4σ(2)
7級 :>=4σ(1)
作為輸出的原始類別需要向讀者澄清一點。平均值是多少?每個標準偏差的范圍是多少?
盡管這些不一致,標準偏差類型的地圖可能是最合適的 因為它的統計來源 . 所有4個字母的國家都是4個標準差,因為它與8.5的平均值有極大的偏差。
中斷分類?
如果你想要 整數 在你的范圍內,那么你應該選擇中斷。所有中斷都是向上或向下舍入每個斷點。因此,與599.364的臨界點不同,它將會變成60萬。
在本例中,很難看到數字的取整程度(它是按5進行分組的),因為上面的所有示例都會產生整數。但是當你有大量的數據,如人口估計(見下文),它會產生一些中斷。
1班 :4–5(29)
2班 :5–10(111)
3班 :10–15(24)
4級 :15–20(10)
第5類 :20–24(2)
作為四舍五入數字的結果,中斷對于您決定的類的數量也是非常挑剔的。
下面是人口估計如何比較數據分類技術:
等間隔:
分位數:
自然斷裂(Jenks):
很好的中斷。現在 很好 :
你自己試試看?
Choropleth地圖使用不同的底紋和顏色來顯示定義區域中的數量或值。
通常情況下,地圖繪制者使用 數據分類 創造自己獨特的**choropleth地圖**。每種數據分類 *** 對讀者的影響不同。
在GIS中有幾種數據分類 *** 。我們用不同的例子概述了它們的差異。使用本指南可以對犯罪率、教育水平和政治水平等進行分類。
您最喜歡的數據分類 *** 是什么?請在下面發表評論。
來源:開源地理空間基金會中文分會
來源鏈接:https://www.osgeo.cn/post/1c32d
本站聲明:網站內容來源于 *** ,如有侵權,請聯系我們,我們將及時處理。