資訊分享_1_為何我們需要可視化?
什麼是可視化(visualization) Webster 字典中visualization的定義如下。 Vi.su.al.i.za.tion [1] 1.Formation of mental visual images 2.The act or process of interpreting in visual terms or of putting into visible form. 簡單的說我們可以把可視化理解成是一個:將抽象的科學或者商業數據.用圖像表示出來.幫助理解數據的意義的過程。它通常會在進行數據分析(data analysis)的過程中大量的使用。 使用可視化呈現信息並不是一個新現象。 大家都聽說過南丁格爾~~ 但大家所不常聽說的是在19世紀中期,克里米亞戰爭爆發。 在這場戰中,雙方死亡人數超過50萬人, 可謂戰況慘烈。南丁格爾當時是英國的一名戰地護士, 她對英國士兵的死亡情況進行了統計對比, 最終發現「因醫療條件惡劣導致的死亡人數,遠遠超過了前線陣亡人數」。 南丁格爾將統計結果繪製成一張圖表, 這張圖表即是被後世稱為「南丁格爾玫瑰圖」的歷史上第一份「極區圖」。 玫瑰圖,刺激了神經麻木的官僚,充分證明了數據可視化的價值, 促成了第一座戰地醫院的建立,從而大大降低了戰爭帶來的死亡率。 不可忽略可視化相較於統計的重要性 許多人對於"Anscombe's quartet"這個名詞應該很陌生, 這是 FJ Anscombe在1973年在他的一篇論文" Graphs in Statistical Analysis "中所提出的, 我們先看到下方四個數據集 對四組數據進行簡單的數據分析, 每組數據有兩個變量, 我們用常用的統計去評估四組數據的特點, 可以得到相同的 Means(平均值): X = 9 Y = 7.5 Variance(總體方差): X = 11Y = 4.122 Correlation(關聯) xy: 0.816 Linear regression(線性回歸方程): Y = 3.0 + 0.5X 好像所有的數據貌似都是一個特點。 一樣的平均值,線性...