東京大学教員の著作を著者自らが語る広場

白い表紙に多数の三角と丸の模様

書籍名

社会科学のためのデータ分析入門 (上) (下)

著者名

今井 耕介 (著)、 粕谷 祐子、原田 勝孝、久保 浩樹 (訳)

判型など

288ページ、A5判、並製

言語

日本語

発行年月日

2018年3月13日

ISBN コード

9784000612456

出版社

岩波書店

出版社URL

書籍紹介ページ

学内図書館貸出状況(OPAC)

社会科学のためのデータ分析入門

英語版ページ指定

英語ページを見る

私が本書を執筆しようと思った理由は、次世代の学生そして若手研究者のみなさんに、政治・経済・教育・公衆衛生などの多岐にわたる重要な社会問題を解決するにあたって、データ分析がいかに強力な道具であるか、ということを実感してもらいたかったからである。この本をきっかけにして、一人でも多くの優秀な若者が、計量社会科学 (Quantitative Social Science) をさらに勉強し、将来様々な分野でデータ分析を社会のために活用してくれれば、本望である。
 
本書はプリンストン大学で私が教えてきた授業の題材を基にして書かれたものである。この授業は、主に社会科学に興味のある学部生を対象にした、データ分析入門を目的としている。従って、本書は既存の教科書とは異なり、最初から実際に出版された論文で使われたデータを統計ソフトウェアを使って直接分析することによって、読者に計量社会科学の魅力を理解してもらうことを最も重要な課題としている。また、確率・統計理論の紹介を本の後半に置き、実験や世論調査などを用いた具体的な研究に最初に触れることによって、統計検定や信頼区間といった抽象的な概念とその必要性も本書の読者にとっては理解しやすくなっているはずである。英語版と異なり、日本語版は上下巻に分かれているが、下巻はテキスト、ネットワーク、そして地理データの分析といった新たな分野を扱っているだけでなく、確率論や統計理論の基礎もカバーしているので、是非上下巻を通して勉強してもらいたい。
 
日本では、大学入試時から理系と文系の区別がなされており、理系の手法を用いて文系の学問を勉強するということがなかなかやりにくい環境がある。しかしながら、いわゆる「ビッグデータ」時代の現在社会においては、学際的なアプローチが必要不可欠になっている。社会問題をデータ分析を用いて解決していくためには、統計や機械学習の知識と社会科学の観点を有効に組み合わせていくことが大切であり、本書が学部・大学院教育における文理融合を大胆に進めていく一つのきっかけになることを期待している。(以上、序文より抜粋)
 

(紹介文執筆者: 法学政治学研究科・法学部 / ハーバード大学 教授 今井 耕介 / 2018)

本の目次

1 イントロダクション
 1.1 本書の概観
 1.2 本書の使い方
 1.3 Rの基礎
  1.3.1 算術演算
  1.3.2 オブジェクト
  1.3.3 ベクトル
  1.3.4 関 数
  1.3.5 データファイル
  1.3.6 オブジェクトを保存する
  1.3.7 パッケージ
  1.3.8 プログラミングと学習のコツ
 1.4 まとめ
 1.5 練習問題
  1.5.1 自己申告に基づく投票率のバイアス
  1.5.2 世界人口の動態を理解する

因果関係
 2.1 労働市場における人種差別
 2.2 Rでデータを部分集合化する
  2.2.1 論理値と論理演算子
  2.2.2 関係演算子
  2.2.3 部分集合化
  2.2.4 簡単な条件文
  2.2.5 因子変数
 2.3 因果効果と反事実
 2.4 ランダム化比較試験
  2.4.1 ランダム化の役割
  2.4.2 社会的プレッシャーと投票率
 2.5 観察研究
  2.5.1 最低賃金と失業率
  2.5.2 交絡バイアス
  2.5.3 事前事後の比較と差の差分法
 2.6 1変数の記述統計量
  2.6.1 分位数
  2.6.2 標準偏差
 2.7 まとめ
 2.8 練習問題
  2.8.1 初期教育における少人数クラスの有効性
  2.8.2 同性婚に関する意見の変化
  2.8.3 自然実験としての指導者暗殺の成功

測 定
 3.1 戦時における民間人の被害を測定する
 3.2 Rで欠損データを扱う
 3.3 1変量の分布をビジュアル化する
  3.3.1 棒グラフ
  3.3.2 ヒストグラム
  3.3.3 箱ひげ図
  3.3.4 グラフの印刷と保存
 3.4 標本調査
  3.4.1 ランダム化の役割
  3.4.2 無回答とその他のバイアス発生要因
 3.5 政治的分極化を測定する
 3.6 2変量関係の要約
  3.6.1 散布図
  3.6.2 相 関
  3.6.3 Q-Qプロット
 3.7 クラスター化
  3.7.1 Rにおける行列
  3.7.2 Rにおけるリスト
  3.7.3 k平均法
 3.8 まとめ
 3.9 練習問題
  3.9.1 同性婚に関する意見の変化再考
  3.9.2 中国とメキシコにおける政治的有効性感覚
  3.9.3 国連総会における投票

予 測
 4.1 選挙結果の予測
  4.1.1 Rにおけるループ (繰り返し)
  4.1.2 Rにおける一般的な条件文
  4.1.3 世論調査からの予測
 4.2 線形回帰
  4.2.1 顔の見た目と選挙結果
  4.2.2 相関と散布図
  4.2.3 最小2乗法
  4.2.4 平均への回帰
  4.2.5 Rにおけるデータの結合
  4.2.6 モデルの当てはまり
 4.3 回帰分析と因果関係
  4.3.1 ランダム化実験
  4.3.2 重回帰モデル
  4.3.3 不均一トリートメント効果
  4.3.4 回帰分断デザイン
 4.4 まとめ
 4.5 練習問題
  4.5.1 賭博市場に基づく予測
  4.5.2 メキシコにおける選挙と条件付き現金給付プログラム
  4.5.3 ブラジルにおける政府間移転支出と貧困削減

事項索引
R索引


【下巻の目次】
発 見
 5.1 テキストデータ
 5.2 ネットワークデータ
 5.3 空間データ
 5.4 まとめ
 5.5 練習問題

確 率
 6.1 確 率
 6.2 条件付き確率
 6.3 確率変数と確率分布
 6.4 大標本理論
 6.5 まとめ
 6.6 練習問題

不確実性
 7.1 推 定
 7.2 仮説検定
 7.3 不確実性を伴う線形回帰モデル
 7.4 まとめ
 7.5 練習問題

次の一歩
 

関連情報

原書:
Kosuke Imai. 2017. Quantitative Social Science: An Introduction. Princeton University Press.
https://press.princeton.edu/titles/11025.html
 

このページを読んだ人は、こんなページも見ています