讀用數據說服:如何設計、呈現和捍衛你的數據02選擇數據圖(上)

1. 選擇數據圖類型
1.1. 數據圖借助了我們發現數據關系的能力
1.2. 數據圖將數據分塊并凸顯重要的對照關系,從而將數據關系可視化
1.3. 確定底層關系是選擇適當數據圖類型的關鍵
- 1.3.1. 首先要確定你想要強調的底層數據關系,然后讓這個關系指導你選擇數據圖
1.4. 數據圖涵蓋了大部分場景,各類受眾都會覺得司空見慣
- 1.4.1. 司空見慣是特征,不是毛病,能讓受眾用更少的認知負荷來解碼數據圖
1.5. 數據圖的目的是將受眾的注意力聚焦到底層數據上,而不是聚焦到編碼數據的圖像上
1.6. 務求簡單。只有在受眾需要的情況下,才選擇復雜的數據圖
1.7. 數據圖呈現數據關系。要選擇適當的數據圖,關鍵是確定受眾需要理解哪一種關系
2. 類別關系
2.1. 類別關系是比較同一個指標在不同類別下的值
2.2. 這是最常見、最直觀的數據關系
2.3. 表示類別關系的詞語
- 2.3.1. 任何與類別成對出現的數量值
2.4. 場景示例
-
2.4.1. 不同產品的銷售額
-
2.4.2. 不同本科專業的畢業率
-
2.4.3. 不同銷售人員的平均成交額
-
2.4.4. 不同織物類型的耐久度
-
2.4.5. 不同人群的廣告觀看量
2.5. 常用數據圖
-
2.5.1. 柱形圖
-
2.5.1.1. 類別關系最適合用常見的柱形圖呈現
-
2.5.1.2. 往往是因為受眾熟悉這種數據圖,認知負荷小
-
2.5.1.3. 縱向柱形圖的適用情況
2.5.1.3.1. 類別比較為主
2.5.1.3.2. 比較項目的數量有限
2.5.1.3.3. 標簽適合橫排
-
2.5.1.4. 橫向柱形圖的適用情況
2.5.1.4.1. 類別太多,一字排開放不下
2.5.1.4.2. 類別名稱太長,在縱向柱形圖里只能斜著放
2.5.1.4.3. 有多個類似的縱向柱形圖,將其中一部分改為橫向能避免混淆
-
-
2.5.2. 簇狀柱形圖
-
2.5.2.1. 簇狀柱形圖可以進行兩個類別間的比較
-
2.5.2.2. 在選擇這種數據圖之前,要確??珙惐容^是有意義的
-
2.5.2.3. 只有當兩張圖確實無法表現出數據關系時,才可以用簇狀柱形圖
-
2.5.2.4. 為主的一類要把柱子貼在一起,這是運用了格式塔原理的連接律,所以更方便受眾觀看
-
2.6. 呈現類別關系的最佳實踐
-
2.6.1. 分類要有意義(通常是基于數據)
- 2.6.1.1. 數據分類排序一定要有意義
3. 時間關系
3.1. 時間關系比較的是相同類別內不同時間點的情況
3.2. 時間通常設為x軸,以左為早,以右為晚
3.3. 表示時間關系的詞語
- 3.3.1. 變化
3.4. 場景示例
-
3.4.1. 上升
-
3.4.2. 增加
-
3.4.3. 波動
-
3.4.4. 增長
-
3.4.5. 降低
-
3.4.6. 下降
-
3.4.7. 減少
-
3.4.8. 趨勢
3.5. 時間關系的常用數據圖
-
3.5.1. 折線圖和柱形圖
-
3.5.1.1. 時間關系通常用折線圖或柱形圖來表示
-
3.5.1.2. 兩者分別強調了數據的不同側面,因為它們將數據分成了不同的塊
3.5.1.2.1. 折線強調數據的總體形狀和趨勢
3.5.1.2.2. 柱形圖強調數值對比
-
3.5.1.3. 相同的數據換用柱形圖來表示,就是強調單個月份,淡化總體趨勢
-
-
3.5.2. 連續折線圖適用情況
-
3.5.2.1. 強調數據的總體形狀
-
3.5.2.2. 討論焦點是模式和趨勢
-
-
3.5.3. 離散柱形圖適用情況
-
3.5.3.1. 強調個別數值
-
3.5.3.2. 討論焦點是特定時間點之間的比較
-
-
3.5.4. 兩點式折線圖被稱為坡度圖
3.6. 呈現時間關系的最佳實踐
-
3.6.1. x軸上的時間要等距分布
- 3.6.1.1. x軸上的時間段要長度相等,不能忽長忽短
-
3.6.2. 選擇有意義的時間間隔
-
3.6.2.1. 時間間隔太密可能會凸顯噪聲,模糊了數據蘊含的模式
-
3.6.2.2. 時間間隔太寬則可能會忽略受眾需要了解的模式
-
3.6.2.3. 適當的間隔要由關系的性質決定
-
4. 總分關系
4.1. 總分關系有兩層含義,一是將總體分成各個部分,二是各個部分的相對比重
4.2. 餅圖表現的就是總分關系
4.3. 表示總分關系的詞語
-
4.3.1. 份額或占總體份額
-
4.3.2. 百分比或占總體百分比
-
4.3.3. 組合
4.4. 場景示例
-
4.4.1. 供應商份額
-
4.4.2. 成本構成
-
4.4.3. 市場格局
-
4.4.4. 消費者組合
4.5. 總分關系的常用數據圖
-
4.5.1. 堆積柱形圖
-
4.5.1.1. 總分關系圖借助格式塔原理的連接律,呈現各個部分是如何構成了總體
-
4.5.1.2. 堆積柱形圖的適用場景
4.5.1.2.1. 強調各個部分是如何構成了總體
4.5.1.2.2. 可以通過排序方式,幫助受眾了解哪些部分較大,哪些較小
4.5.1.2.3. 包含所有部分
4.5.1.2.3.1. 不得省略總體的任何一個組成部分
-
-
4.5.2. 簇狀柱形圖的適用場景
-
4.5.2.1. 強調各個部分的比重
-
4.5.2.2. 不一定呈現所有部分
-
4.5.2.3. 可以通過加注或語境暗示的方式,強調圖中部分總和比例為100%
-
-
4.5.3. 如果總分關系非常重要,有理由讓受眾承受更大的認知負荷,那還可以選用另外兩種更復雜的數據圖,即瀑布圖和馬賽克圖
-
4.5.4. 瀑布圖
-
4.5.4.1. 瀑布圖是將堆積柱形圖橫向拆分,強調每個類別比某個基準值大多少或小多少
-
4.5.4.2. 不同于堆積柱形圖,瀑布圖可以有負值,而且能夠表現出各個部分的次序
-
4.5.4.3. 還可以加入色調等編碼,而不至于像多色堆積柱形圖那樣顯得雜亂
-
4.5.4.4. 適用于流入(比如收入)和流出(比如支出)合起來構成整體的情況
-
4.5.4.5. 瀑布圖的適用場景
4.5.4.5.1. 總體中既包含正的部分,也包含負的部分
4.5.4.5.2. 除了數值相加以外,還有其他有意義的次序
4.5.4.5.3. 受眾對話題足夠感興趣,能夠容忍相當程度的認知負荷
-
-
4.5.5. 馬賽克圖
-
4.5.5.1. 有時叫作mekko圖,得名于芬蘭紡織設計公司Marimekko,該公司以大膽的彩色幾何圖案聞名
-
4.5.5.2. 有時被形容為“方餅圖”?,同時利用高度和寬度來編碼數據
-
4.5.5.3. 每根柱子的寬度代表大類的總值,高度代表大類下的各個小類的值
-
4.5.5.4. 與簇狀柱形圖一樣,馬賽克圖也可以用于大類內部或大類之間的比較
-
4.5.5.5. 馬賽克圖濃縮了大量信息
4.5.5.5.1. 對受過訓練的人來說,信息密度大的馬賽克圖非常好用,但對沒有受過訓練的人來說,馬賽克圖會帶來明顯的認知負荷
-
4.5.5.6. 馬賽克圖的適用場景
4.5.5.6.1. 呈現兩個類別的總分關系
4.5.5.6.2. 理解這種數據圖需要大量講解,受眾能夠容忍這一點
-
4.5.5.7. 馬賽克圖常常用來表示多級市場細分矩陣
-
4.6. 呈現總分關系的最佳實踐
-
4.6.1. 類別比較一定要有共同的基準線
-
4.6.1.1. 堆積柱形圖的一個缺點是,柱子中段的各個部分難以相互比較,因為沒有共同的基準線
-
4.6.1.2. 必須有共同的基準線,受眾才容易進行比較
-
-
4.6.2. 各部分排序一定要有意義
-
4.6.2.1. 與所有類別比較一樣,總分關系下的各部分排序也一定要有意義—通常是按照從大到小的順序
-
4.6.2.2. 有助于受眾區分大小相近的部分
-
4.6.2.3. 時間排序是有意義的
4.6.2.3.1. 相比于按收入多少給每天的時段排序,時間順序會更直觀
-
-
4.6.3. 盡量不要用餅圖,除了有限的場景以外
-
4.6.3.1. 餅圖是最廣為人知的數據圖之一
4.6.3.1.1. 作為大多數人最早學到的圖表之一,幾乎所有人都能一眼看出來餅圖表示總分關系
4.6.3.1.2. 餅圖在數值識讀方面會給受眾帶來巨大挑戰
-
4.6.3.2. 由于餅圖的種種缺點,很多可視化專家都不提倡,甚至直接禁止使用餅圖
4.6.3.2.1. 受眾難以精確比較各個部分的大小
4.6.3.2.2. 除了最大的幾個部分外,其余部分的標簽難以辨認
-
4.6.3.3. 餅圖中大小相近的部分很難比較
-
4.6.3.4. 排列順序暗示了每個部分的大小關系,但任何一個部分的百分比都難以估算
-
4.6.3.5. 只要部分數目稍微多一點兒,餅圖就很難加標簽了,最小部分的標簽更是沒法識讀
-
4.6.3.6. 柱形圖可以更精確、更清晰地傳達同樣的信息
-
4.6.3.7. 餅圖有一個重大優勢:熟悉
4.6.3.7.1. 人們知道餅圖傳達的是總分關系,而且各個部分合起來就是總體,哪怕具體數值難以識讀
-
4.6.3.8. 餅圖只在有限場景下值得考慮
4.6.3.8.1. 總體只包括幾個部分
4.6.3.8.2. 各部分之間差距大且明顯
4.6.3.8.3. 沒有小的部分(或者可以合并為“其他”?)?
4.6.3.8.4. 重點在于展示總體的所有組成部分,而非部分之間的比較
4.6.3.8.5. 受眾不習慣以圖片化方式獲取信息
-
浙公網安備 33010602011771號