kaeken(嘉永島健司)のTech探究ブログ

主に情報科学/情報技術全般に関する知見をポストします。(最近は、特にData Science、機械学習、深層学習、統計学、Python、数学、ビッグデータ)

目次 Fundamentals of Data Visualization まとめ

Fundamentals of Data Visualization まとめ

Link

  • 英語版

Fundamentals of Data Visualization [Book]

  • 無料公開Web版

Fundamentals of Data Visualization

  • 日本語版

O'Reilly Japan - データビジュアライゼーションの基礎

概要

  • Effective visualization is crucial for communicating information from complex datasets in natural and social sciences.
  • The increasing power of visualization software offers many choices and options, often overwhelming for scientists, engineers, and business analysts.
  • The book provides guidelines for creating clear and compelling figures from large datasets, focusing on choosing the right visualization type.
  • Author Claus O. Wilke emphasizes the critical elements of successful data visualization.
  • Key concepts include using color to highlight, distinguish, or represent values, and the importance of redundant coding for conveying information in multiple ways.
  • The book includes a visualizations directory as a guide to commonly used types of data visualizations.
  • Readers will find extensive examples of both effective and ineffective figures.
  • It covers how to effectively use figures in documents or reports to tell a compelling story.

  • 効果的なビジュアライゼーションは、自然科学と社会科学の複雑なデータセットから情報を伝えるために不可欠です。

  • 可視化ソフトウェアの増加するパワーは、科学者、エンジニア、ビジネスアナリストに多くの選択肢とオプションを提供し、しばしば圧倒されます。
  • この本は、大規模なデータセットから明確で魅力的な図を作成するためのガイドラインを提供し、正しいビジュアライゼーションのタイプを選択することに焦点を当てています。
  • 著者のクラウス・O・ウィルケは、成功したデータビジュアライゼーションに最も重要な要素を教えてくれます。
  • 色を使って強調、区別、または価値を表す基本概念、重要な情報を複数の方法で提供するための冗長コーディングの重要性を理解します。
  • 一般的に使用されるデータビジュアライゼーションのタイプを案内するビジュアライゼーションディレクトリを含みます。
  • 効果的な図と効果的でない図の広範な例を見つけることができます。
  • 文書やレポートで図を効果的に使用し、魅力的なストーリーを伝える方法を学びます。

目次en

  • 1 Introduction
  • Part I: From data to visualization
  • 2 Visualizing data: Mapping data onto aesthetics
  • 3 Coordinate systems and axes
  • 4 Color scales
  • 5 Directory of visualizations
  • 6 Visualizing amounts
  • 7 Visualizing distributions: Histograms and density plots
  • 8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots
  • 9 Visualizing many distributions at once
  • 9.1 Visualizing distributions along the vertical axis
  • 9.2 Visualizing distributions along the horizontal axis
  • 10 Visualizing proportions
  • 11 Visualizing nested proportions
  • 12 Visualizing associations among two or more quantitative variables
  • 13 Visualizing time series and other functions of an independent variable
  • 14 Visualizing trends
  • 15 Visualizing geospatial data
  • 16 Visualizing uncertainty
  • Part II: Principles of figure design
  • 17 The principle of proportional ink
  • 18 Handling overlapping points
  • 19 Common pitfalls of color use
  • 20 Redundant coding
  • 21 Multi-panel figures
  • 22 Titles, captions, and tables
  • 23 Balance the data and the context
  • 24 Use larger axis labels
  • 25 Avoid line drawings
  • 26 Don’t go 3D
  • Part III: Miscellaneous topics
  • 27 Understanding the most commonly used image file formats
  • 28 Choosing the right visualization software
  • 29 Telling a story and making a point
  • 30 Annotated bibliography

目次ja

1章 はじめに
    1.1 見栄えの悪い図、不適切な図、誤った図

第Ⅰ部 データからビジュアライゼーションへ

2章 データを可視化する:データからエスセティクスへのマッピング
    2.1 エスセティクスとデータの種類
    2.2 スケールによってデータの値をエスセティクスにマッピング

3章 座標系と座標軸
    3.1 直交座標系
    3.2 非線形座標軸
    3.3 曲がった軸を持つ座標系

4章 カラースケール
    4.1 区別するためのツールとしての色
    4.2 データの値を表現するための色
    4.3 目立たせるためのツールとしての色

5章 ビジュアライゼーション概説
    5.1 量
    5.2 分布
    5.3 内訳
    5.4 2変数の関係
    5.5 地理空間データ
    5.6 不確かさ

6章 量を可視化する
    6.1 棒グラフ
    6.2 棒グラフのグループ化と積み重ね棒グラフ
    6.3 ドットプロットとヒートマップ

7章 分布を可視化する:ヒストグラムと密度プロット
    7.1 単一の分布を可視化する
    7.2 複数の分布を一度に可視化する

8章 分布を可視化する:経験的累積分布関数とQ-Qプロット
    8.1 経験的累積分布関数
    8.2 歪みの大きい持つ分布
    8.3 分位数-分位数(Q-Q)プロット

9章 たくさんの分布を一度に可視化する
    9.1 縦軸方向の分布を可視化する
    9.2 横軸方向の分布を可視化する

10章 内訳を可視化する
    10.1 円グラフの場合
    10.2 横並び棒グラフの場合
    10.3 積み上げ棒グラフや積み上げ密度グラフの場合
    10.4 全体に対する各要素の内訳を別々に可視化する

11章 入れ子になった内訳を可視化する
    11.1 入れ子になった内訳の誤った可視化
    11.2 モザイク図とツリーマップ
    11.3 円グラフの入れ子
    11.4 パラレルセットプロット

12章 複数の量的変数間の関連性を可視化する
    12.1 散布図
    12.2 コレログラム
    12.3 次元削減
    12.4 対応のあるデータ

13章 時系列などの独立変数の関数を可視化する
    13.1 1本の時系列
    13.2 複数の時系列と用量反応曲線
    13.3 応答変数が複数存在する時系列

14章 トレンドを可視化する
    14.1 平滑化
    14.2 定義された関数形式を用いたトレンドの表示
    14.3 デトレンドと時系列データの分解

15章 地理空間データを可視化する
    15.1 投影法
    15.2 レイヤー
    15.3 コロプレス図
    15.4 カルトグラム

16章 不確かさを可視化する
    16.1 確率を度数としてフレーミングする
    16.2 点推定の不確かさの可視化
    16.3 曲線をあてはめる際の不確かさの可視化
    16.4 仮説結果プロット

第Ⅱ部 図のデザインの原則

17章 プロポーショナルインクの原則
    17.1 線形軸方向の可視化
    17.2 対数軸を用いた可視化
    17.3 面積を直接用いた可視化

18章 重なり合った点の扱い方
    18.1 半透明化とジッタリング
    18.2 2次元ヒストグラム
    18.3 等値線図

19章 色を使う際によくはまる落とし穴
    19.1 あまりにも多くの情報や無意味な情報の表現に使ってしまう
    19.2 非単調なカラースケールをデータの値の表現に使ってしまう
    19.3 色覚異常を考慮しないデザイン

20章 表現の冗長化
    20.1 表現の冗長化を用いた凡例の設計
    20.2 凡例を用いない図の設計

21章 マルチパネル図
    21.1 スモールマルチプルプロット
    21.2 複合図

22章 タイトル、キャプション、表
    22.1 図のタイトルとキャプション
    22.2 軸や凡例のタイトル
    22.3 表

23章 データとコンテキストのバランスをとる
    23.1 適切な量のコンテキストを提供する
    23.2 背景のグリッド
    23.3 対応のあるデータ
    23.4 まとめ

24章 軸のラベルをもっと大きくする

25章 線画を避けよう

26章 3Dに走らない
    26.1 余計な3Dを使わない
    26.2 3Dの位置スケールを使わない
    26.3 3Dビジュアライゼーションの適切な使用

第Ⅲ部 その他のトピック

27章 一般的な画像ファイル形式を理解する
    27.1 ビットマップ画像とベクトル画像
    27.2 ビットマップ画像の可逆・非可逆圧縮
    27.3 画像形式間での変換

28章 適切な可視化ソフトウェアを選ぶ
    28.1 再現性と反復性
    28.2 データ探索とデータ表現
    28.3 コンテンツとデザインの分離

29章 ストーリーを伝え、強調する
    29.1 ストーリーとは何か?
    29.2 司令官に伝わる図を作る
    29.3 図を徐々に複雑にする
    29.4 図を覚えてもらいやすくする
    29.5 一貫性を持たせ、しかし、反復はしない

付録A 参考文献の手引き
    A.1 データと可視化についての考え方
    A.2 プログラミングの書籍
    A.3 統計学の教科書
    A.4 歴史的な教科書
    A.5 関連する幅広いトピックについての書籍

付録B テクニカルノート

参考文献
索引

TODO

TODO 各章ごとに要約してリンク