一圖勝千表_數據可視化_基本圖表篇
markdown
### [為何我們需要可視化(visualization)?](https://b10231040.blogspot.com/2018/08/1.html)
Webster 字典中visualization的定義如下。
Vi.su.al.i.za.tion [1]
1.Formation of mental visual images
2.The act or process of interpreting in visual terms or of putting into visible form.
將抽象的科學或者商業數據.用圖像表示出來.幫助理解數據的意義的過程。
它通常會在進行數據分析(data analysis)的過程中大量的使用
從數據展示需求的角度選擇恰當的圖表,可以更好的形式彰顯數據的潛在性、規律性與價值
數據的展現包括用圖表展示數據和用統計量描述數據等內容
圖表的類型有數十種以上
![](https://i.imgur.com/j92iRKt.png)
不同的圖表展現出的資訊也不同
適合的資料呈現對於讀者來說能用最少的時間來了解你所呈現的內容
下面整理一些常見的圖表類型說明基本圖表的特點和適用場合
## 柱狀圖(Bar Chart)
我們經常看到條形圖,很容易忽視它們的效果
條形圖可以顯示值隨時間的變化
適用場合是二維數據集(每組數據點包括兩個值x和y)
或者它們可以提供多個類別的直接比較
![](https://i.imgur.com/JGdgmcv.jpg)
注意的是資料類別不適合過多
柱狀圖的X軸可以很適合用於時間維
讀者習慣性認為存在時間趨勢
如果遇到X軸不是時間維的情況,建議用顏色區分每根柱子
改變用戶對時間趨勢的關注
![](https://i.imgur.com/YzMhwhL.jpg)
或是使用垂直排列的方式
![](https://i.imgur.com/mliAyCK.jpg)
## 折線圖(Line Chart)
折線圖也適用場合是二維數據集(每組數據點包括兩個值x和y)
比柱狀圖更適合呈現時間序列或是先後順序的差異
折線圖特別擅長於揭示數據的整體趨勢
![](https://i.imgur.com/DuUyCFJ.jpg)
也適合多個二維數據集比較變動趨勢的交互關係
![](https://i.imgur.com/2ALGfE2.jpg)
## 圓餅圖(Pie Chart)
圓餅圖是應避免使用的圖表
因為讀者對於面積大小並不敏感
![](https://i.imgur.com/TcHq3kr.jpg)
下圓餅圖的五個色塊的面積大小排序並不容易看出來
若換成下面的換成柱狀圖就容易多了
![](https://i.imgur.com/yuGLzED.jpg)
或者也可以嘗試一些變形的方式利用數據大小來表示其每個扇形半徑
這方式也稱為[南丁格爾玫瑰圖(Nightingale Rose Chart)]http://blog.infographics.tw/2016/02/nightingale-rose-chart/)
![](https://i.imgur.com/6HaZY7n.jpg)
或稱為風玫瑰圖(wind rose chart)
![](https://i.imgur.com/77oTLRY.jpg)
## 散佈圖(Scatter Chart)
柱狀圖通常對於可視化由單個數量組成的數據
散佈圖適用於三維數據集,但其中只有兩維需要比較
識別兩個維之間的關係類型
![](https://i.imgur.com/uQ3NAsI.jpg)
如果點是彩色編碼的話,則可以顯示一個附加變量
![](https://i.imgur.com/cigQ0Ce.jpg)
或是以三維方式呈現更多變量間的關係
![](https://i.imgur.com/EeVmCOy.jpg)
## 氣泡圖(Bubble Chart)
氣泡圖是散佈圖的一種變型
通過每個點的面積大小
反映第三維的數據大小
![](https://i.imgur.com/3huDn3X.jpg)
也常用於單一維度的資料比較
![](https://i.imgur.com/R2eqXR9.jpg)
或者使用於地圖資料中
![](https://i.imgur.com/eSClIt4.jpg)
## 雷達圖(Radar Chart)
有著許多別稱 spider charts, polar charts, web charts, or star plots
與玫瑰圖有許多類似的地方
適用於多變量數據的可視化
並且通過多邊形的大小和形狀可以明顯看出總體差異
![](https://i.imgur.com/CxgVMWC.jpg)
## 箱形圖(boxplot)
是一種用作顯示一組數據分散情況資料的統計圖
因型狀如箱子而得名。此圖中之盒子之外
也常會有線條在上下四分位數之外延伸出去,像是鬍鬚,因此也稱為盒鬚圖
![](https://i.imgur.com/9zd7jIC.jpg)
盒鬚圖可以呈現許多資訊例如集中趨勢(中位數,平均值和分布模式)
## 小提琴圖(violin plot)
這算是盒鬚圖的變形
![](https://i.imgur.com/nEWDlUX.jpg)
最大差異在他不規則的外型,顯示了資料分布密度
![](https://i.imgur.com/287Dzk8.jpg)
## 馬賽克圖(Mosaic plot)
是用於從兩個或更多個性質變量可視化數據的圖示方法
概述了數據的結構,並可以識別不同變量之間的關係
![](https://i.imgur.com/Zh4COr4.jpg)
## 樹狀圖(Treemapping)
一種使用嵌套圖形(通常是矩形)顯示分層數據的方法
矩形面積表示出數據的大小
![](https://i.imgur.com/QUxBA9f.jpg)
## 熱點圖(Heat map)
其中包含在一個矩陣單獨數值被以顏色表示數據大小的圖形
多運用於生物基因分析上的基因表現關係
![](https://i.imgur.com/KEftIhB.jpg)
## 等高線圖(Contour map)
最常運用於地圖繪製上
如果您要找到兩組數據之間的最佳組合也非常適合
在實驗設計中的反應曲面法(Response surface methodology, RSM)
就會繪製等高線圖或曲面圖來觀察最佳配比與變數間趨勢
![](https://i.imgur.com/Ank8ZZD.jpg)
## 桑基圖(Sankey diagram)
不同的線條代表了不同的流量分流情況,它的寬度成比例地顯示此分支佔有的流量
桑基圖通常應用於能源、材料成分、金融等資料視覺化分析
![](https://i.imgur.com/P6f7gjG.jpg)
![](https://i.imgur.com/TD1dJFh.jpg)
# 可視化線上服務
## [PLOTDB](https://plotdb.com/)
說了這麼多圖表在最後介紹一款線上的生成網站
內建非常多種圖表
![](https://i.imgur.com/JIX09Qo.jpg)
![](https://i.imgur.com/4iG7l2L.gif)
用來製作簡報的圖表也非常適合
且不用安裝就可以直接使用
![](https://i.imgur.com/BRmNrKZ.gif)
## 色盲在可視化上的問題
有些配色對色盲和色弱讀者而言,要在圖表上分辨這些顏色恐怕有困難
這是許多可視化過程中會忽略的事情
而且還有一項功能就是可以測試配色對於色盲的讀者是否合適的功能
內建選單可以快速切換模式
讓我們了解到對於色盲讀者的觀看效果
![](https://i.imgur.com/hCzXNsd.gif)
留言
張貼留言