數(shù)據(jù),現(xiàn)在似乎已經(jīng)成為了很多事情的基礎(chǔ)。一個好的研究,和研究中得到的良好數(shù)據(jù),可以讓任何問題都得到科學(xué)的解釋,而并非僅僅只是通過“直覺”來解決。
學(xué)術(shù)界、醫(yī)學(xué)界等等一向都很重視對數(shù)據(jù)的收集和對數(shù)據(jù)的分析,以提供合理的建議或者治療方案?,F(xiàn)在,隨著可視化分析工具和算法的發(fā)展,任何人都可以獲取海量數(shù)據(jù),可以通過收集、分類、生產(chǎn)和分析數(shù)據(jù)來推動各個經(jīng)濟部門制定商業(yè)決策,比如:
· 銀行分析消費者的金融行為,確定為其提供什么貸款產(chǎn)品。
· 保險業(yè)確定保險費金額。
· 醫(yī)療保健業(yè)確定個性化的治療方案,預(yù)測疾病的爆發(fā),確定流感疫苗的成分,甚至可以讓醫(yī)院的人員配置需求更有效率。
· 消費品行業(yè)和服務(wù)業(yè)用它驅(qū)動一切,從庫存需求到開發(fā)新品(或改進現(xiàn)有產(chǎn)品),到確定目標(biāo)受眾以及制定接觸目標(biāo)受眾的措施等。數(shù)據(jù)自身也有其受眾——股東,C級行政決策者、醫(yī)療專業(yè)人員、教師和營銷人員等。
現(xiàn)在面臨的問題是:受眾往往對統(tǒng)計分析并不那么了解。因此盡可能以簡單的方式像受眾展示數(shù)據(jù)至關(guān)重要,比如用可視化的形式——圖表、曲線圖、信息圖等來展示,這樣會讓受眾更容易理解。
因此,如果你要向外行人士展示數(shù)據(jù)的話,一定要避免落入下面的陷阱。
1. 對數(shù)據(jù)使用錯誤的可視化工具
你展示數(shù)據(jù)的目的是什么?
你是根據(jù)研究問題劃分研究群體嗎?如果是,餅圖很不錯。
你要比較人口、時間嗎?如果是,柱狀圖更好。
如果你想比較兩件事(例如,高管和普通員工隨時間推移的平均加薪情況),線形圖是很好的選擇。
但是,研究員、統(tǒng)計學(xué)家和設(shè)計師們往往執(zhí)著于特定類型的圖表或曲線圖,他們嘗試“強行”將其數(shù)據(jù)轉(zhuǎn)換成特定格式,但結(jié)果常常并不是很清晰。看看相似類型的數(shù)據(jù)可視化方式,你會發(fā)現(xiàn),你可以用之前沒用過的設(shè)計來更好地展示自己的數(shù)據(jù)。
2. 將過多的數(shù)據(jù)堆到一張可視化圖里
一般如果你想展示所有的信息,那么就很容易把所有想說的全放到一張可視化圖里??赡苣阒缊D里所有小細節(jié),而受眾卻并非如此。
你可以想想展示的主要目的,以及還有什么更小的細節(jié)可以忽略嗎?你能把復(fù)雜的演示拆分成一系列的可視化圖,而不是把它全塞到一張圖里嗎?
要記得從受眾的角度看看你的圖,特別是當(dāng)以非口頭解釋和接受提問的方式向觀眾展示的時候?,F(xiàn)場展示時,你可以預(yù)估觀眾的反應(yīng),澄清誤解,解答問題,但若非現(xiàn)場展示就不能這樣了。
3. 可視化圖太“滿”
圖里有多種顏色和各種圖形當(dāng)然可以,但是過多的話就會分散受眾的注意力。當(dāng)顏色或圖形太多的時候,往往會引起受眾的厭倦而不想去看。
看看下面這張美國發(fā)電廠的數(shù)據(jù)可視化圖就明白了。
你仔細研究這張圖的動力有多大? 僅僅是顏色就讓人難以應(yīng)付了,你甚至很難辨認(rèn)這些顏色表示的是哪根條柱。這就是典型的太“滿”的可視化圖。
強烈建議制作者找一個更簡潔的模型,或者把數(shù)據(jù)放到幾張圖里,然后說明該國不同地區(qū)的趨勢。
4. 令人困惑或錯誤的數(shù)學(xué)
一旦一張圖表里出現(xiàn)了相加后的和不是100或者雖然數(shù)學(xué)上沒有錯誤但卻令人困惑的數(shù)字,數(shù)據(jù)可視化就就毫無價值了。比如很常用的用于表現(xiàn)百分比的餅狀圖——百分比的總和必須為100,否則就會讓人感到困惑,懷疑數(shù)據(jù)的正確性。
下面是一個典型案例,在2012年美國總統(tǒng)初選期間,餅狀圖出現(xiàn)了嚴(yán)重錯誤。
可能這一張可視化的圖配有解釋文字,但觀眾很可能不會去看。他們將只會看到兩件事——百分比加起來和為193。這是不可能的,而且餅狀圖中支持Palin的部分的面積比另外兩位候選人的要小,雖然那兩個候選人的百分比更小。總之,這就是一個災(zāi)難性的數(shù)據(jù)可視化。
實際上,研究員允許受訪者選擇多位候選人,于是就得到這一數(shù)學(xué)結(jié)果。這場災(zāi)難的補救措施是只允許選擇一個候選人,這樣百分比相加的和就是100了,或者將這一可視化圖分成三張圖,每位候選人一張,并標(biāo)注受訪者的第一,第二,第三選擇。
5. 缺乏數(shù)據(jù)來源
數(shù)據(jù)的有效性取決于其來源,學(xué)者和研究員都明白這一點。非學(xué)者在收集數(shù)據(jù)、創(chuàng)建圖表的時候,可能不明白標(biāo)注數(shù)據(jù)來源以及使用可信賴數(shù)據(jù)的重要性。
一手資源是指研究人員通過自己收集分析數(shù)據(jù)得到的資源,在將數(shù)據(jù)可視化的時候,如果要使可視化可信,就應(yīng)該使用這些一手資源。
6. 在發(fā)布或展示之前沒有進行測試
當(dāng)你全身心投入到創(chuàng)作中時,很可能無法意識到一些顯而易見的錯誤或者誤區(qū)。這個問題的解決辦法是,先向不熟悉該數(shù)據(jù)主體的朋友或同事展示你的可視化圖,然后讓他們解釋給你聽。如果他們解釋得很好,你就可以發(fā)布了。