東京大学教員の著作を著者自らが語る広場

白い表紙に金色で大きくDとSの字がレイアウト

書籍名

データサイエンス入門 教養としてのデータサイエンス

著者名

北川 源四郎、 竹村 彰通 (編)

判型など

240ページ、A5判

言語

日本語

発行年月日

2021年6月15日

ISBN コード

978-4-06-523809-7

出版社

講談社

出版社URL

書籍紹介ページ

学内図書館貸出状況(OPAC)

教養としてのデータサイエンス

英語版ページ指定

英語ページを見る

人類社会はいま歴史の転換点に直面しています。言うまでもなく、ビッグデータの出現とデータサイエンスやAIなどのデータの活用技術の飛躍的発展を背景とするデータ駆動社会への転換です。自動運転、機械翻訳、画像認識、スマホ活用、コンピュータゲームなど、生活のあらゆる場面で21世紀初頭とは全く違う世界が拓かれつつあることは日々実感していることと思います。このような新しい社会の実現を視野に、政府は「AI戦略2019」において、デジタル社会の読み・書き・そろばんともいうべき「数理・データサイエンス・AI」の基礎を50万人のすべての大学生が習得すべきとしています。これに対応して数理・データサイエンス教育強化拠点コンソーシアムでは、2020年に産業界や関係団体の協力も得て、「導入」、「基礎」、「心得」、「オプション」の4部構成で約250のキーワード (知識・スキル) からなる数理・データサイエンス・AIのリテラシーレベルのモデルカリキュラムを公表しました。
 
本書は、このモデルカリキュラムのうち「オプション」を除く「導入」、「基礎」、「心得」のキーワードを網羅した完全準拠の入門書として執筆されたものです。3章11節構成のそれぞれの節は、日本を代表する研究者や実務家の方々に執筆していただき、多くの実際的な事例の紹介や豊富な図表を取り入れています。「導入」の章では、データ活用によって社会で実際に起きている変化を紹介するとともに、実際に活用されているデータ、データ活用のための技術、最新動向なども紹介し、データサイエンスやAIを学ぶ必要性を実感できるようにしています。「基礎」の章では、データを読む (分析の方法)、データを説明する (可視化),データを扱う (表計算) という最も基礎的なデータ活用技術の概略を学びます。その一方、「心得」の章では、AI活用の結果生じうる負の事例を紹介しながら、ELSIや倫理などのデータサイエンスやAIを適用する上での留意事項や、情報セキュリティやプライバシー保護などのデータを取り扱うときに守るべき事項を学びます。
 
本書によって、すべての大学生がデジタル社会のパスポートともいえるデータサイエンスの必須事項を習得し、データ活用社会を享受できるようになることを期待しています。なお、リテラシーレベルのカリキュラムのうち本書では取り上げていない「オプション」に興味がある場合や、本書の内容を超えてより深く学びデータ駆動型社会の発展に貢献する意欲がある場合には、「データサイエンス入門」シリーズの他の11巻に進むことを推奨します。
 

(紹介文執筆者: 情報理工学系研究科 / 数理・情報教育研究センター 特任教授 北川 源四郎 / 2022)

本の目次

第1章 [導入] 社会におけるデータ・AI利活用
1.1 社会で起きている変化 (樋口知之)
ビッグデータ / 検索エンジンとSNS / 第4 次産業革命 / AI の驚異的発達 / 人間の知的活動とAI
1.2 社会で活用されているデータ (樋口知之)
データの種類 / データの所有者 / 構造化データと非構造化データ / 自動翻訳
1.3 データとAI の活用領域 (孝忠大輔)
事業活動におけるデータ・AI 活用の広がり / 活用目的ごとのデータ・AI 活用の広がり
1.4 データ・AI 利活用のための技術 (内田誠一)
誰もが無意識にデータを解析して生きている / さまざまなデータ解析 — 予測 / さまざまなデータ解析 — グルーピングとクラスタリング / さまざまなデータ解析 — 発見 / データ解析の関連話題 / 非構造化データ処理 / データ可視化 / パターン認識技術 / 人工知能
1.5 データ・AI 活用の現場 (丸山 )
データ分析による意思決定 / 情報技術による自動化 / データ分析・自動化の実際 / 組織的考慮点
1.6 データ・AI 利活用の最新動向 (内田誠一)
AI 等を活用した新しいビジネスモデル / AI 最新技術の活用例
 
第2章 [基礎] データリテラシー
 2.1 データを読む (川崎能典)
データの種類 / データの分布と代表値 / 代表値の性質の違い / データのばらつき / 観測データに含まれる誤差の扱い / 打ち切りや脱落を含むデータ、層別の必要なデータ / 相関と因果性 / 母集団と標本抽出 / クロス集計表、相関係数行列、散布図行列 / 統計情報の正しい理解
2.2 データを説明する (椎名 )
データの表現 / データの図解表現 / データの比較 / 不適切なグラフ表現 /  優れた可視化の例
2.3 データを扱う (川崎能典)
表形式のデータ / データ解析ツール / SSDSE データを扱う
 
第3章 [心得] データ・AI利活用における留意事項
 3.1 データ・AI を扱う上での留意事項 (中川裕志)
ELSI / 一般データ保護規則:GDPR / 十分性認定 / AI 倫理 / AI 脅威論 / ブラックボックス化 / 説明可能性 / アカウンタビリティ、透明性、トラスト / 公平性 / データ・AI 活用における負の事例紹介—データの悪用・目的外利用 / データ・AI 活用における負の事例紹介—フラッシュクラッシュ
3.2 データを守る上での留意事項 (佐久間淳)
データサイエンスにおけるセキュリティとプライバシー / データサイエンスと情報セキュリティ / データサイエンスとプライバシー

関連情報

受賞:
第15回日本統計学出版賞 (日本統計学会 2022年)
https://www.jss.gr.jp/society/prize/prize_biog2022/
 
書評:
白石壮馬 評 (『電子情報通信学会誌』Vol.105 No.2 2022年2月)
https://www.ieice.org/jpn_r/journal_backnumber/
 
石井一夫 評 (『情報処理』Vol.63 No.2 2022年2月号)
https://www.ipsj.or.jp/magazine/magazine.html
 
中島悠太 評 (『映像情報メディア学会誌』Vol. 76 No. 1 2022年1月)
https://www.ite.or.jp/content/journal/
 
話題の本 (日刊工業新聞19面 2021年10月27日)

このページを読んだ人は、こんなページも見ています