AI / データサイエンス ライブラリ“基礎から応用へ” 2 異常検知からリスク管理へ
本書はデータサイエンスの技術の1つである異常検知技術について解説したものです。異常検知とは大量のデータから「外れ値」や「変化」といった異常を効率的かつ高精度に検出する技術です。異常検知はマーケティング、セキュリティ、医療、金融などの広い分野に適用され、データサイエンスの中でも特に重要な技術と見なされています。本書は異常検知の基礎理論とともに、リスク管理分野、特に経済、教育、セキュリティ分野への応用を示すものです。本書の特徴は、基礎理論から応用への架け橋に重きを置いて書かれているところにあります。
第1章では、異常検知を大きく「外れ値検知」と「変化検知」に分けて、異常検知の基礎を解説しています。前者は他とは空間的に大きく離れた異常点を検知することです。後者はデータ源の時間的な変動を検知することです。いずれもデータの規則性を学習することが基本となっています。本書の特徴は、これらの学習について「情報論的学習理論」に基づいて説明しているところです。情報論的学習理論とは、機械学習を「どれだけ情報量を獲得したか」という立場から定量的に解き明かす理論です。それによって見通しのよい異常検知の体系を学ぶことができます.
第2章では、変化検知の経済データへの応用を紹介しています。例えば、株価時系列の変化検知により、その背後にある経済的なイベント (バブル発生や大地震など) の発生を同定できることを示しています。また、株主と株式をノードとし、株式所有をエッジとしたネットワークを考え、その変化検知を行うことによって、コーポレートガバナンスのマクロな変動を捉えることができることを示します。
第3章では、異常検知の教育データ解析への応用を示しています。近年、教育の現場ではデジタル学習環境の発達により、学習活動に関する大量データが蓄積されています。本章では、このような学習活動データへの異常検知技術の適用例を示しています。例えば、学習活動の履歴をクリックストリームとして捉え、その変化を検知することで、教材や授業の効果が上がったのか否かを検証できることを示しています。また、デジタル教材閲覧行動の外れ値検知によって、大多数の学習者と異なる教材閲覧行動をした学習者をあぶり出すことができます。これによって、きめの細かい学習支援ができることを示しています。
第4章では、リスク管理の一形態として、分散分権型環境での機械学習を紹介しています。民主主義、多様性、プライバシーといった3つの制約条件をもつ学習問題考えると、分散分権型学習は秘匿集計という問題に帰着されます。本章では、具体的な秘匿集計の方法を紹介しています。
本書を通じて、異常検知の理論をしっかりと学ぶことができると同時に、その応用の実際ついて、豊富な事例を基に学ぶことができます。
(紹介文執筆者: 情報理工学系研究科 教授 山西 健司 / 2023)
本の目次
1.1 異常検知の基礎的考え方
1.2 外れ値検知 (パターンに基づく方法)
1.3 外れ値検知 (復元に基づく方法)
1.4 パラメータ変化検知 (突発的変化検知)
1.5 パラメータ変化検知 (漸進的変化検知)
1.6 潜在構造変化検知 (突発的変化検知)
1.7 潜在構造変化検知 (漸進的変化検知)
1.8 ネットワーク異常検知
1.9 まとめ
第2章 金融時系列と株式所有ネットワークの変化点検知|久野遼平
2.1 単一金融時系列の変化点検知
2.2 複数金融時系列の精度行列の変化点検知
2.3 株式所有ネットワークの変化点検知
2.4 まとめ
第3章 変化検知の教育分野への応用|島田敬士、峰松 翼
3.1 クリックストリームデータの変化検知
3.2 デジタル教材閲覧行動の異常検知
3.3 まとめ
第4章 分散分権型環境での機械学習とリスク管理|井手 剛
4.1 分散分権型の学習問題
4.2 多様性を保証するための異常検知モデル
4.3 分権型合意形成問題
4.4 秘匿集計問題
4.5 スパース混合ガウスモデルによる分散分権型学習
4.6 まとめ
あとがき
参考文献
索引
関連情報
若林秀樹 評 (『数理科学』 2023年7月号)
https://www.fujisan.co.jp/product/1399/b/2402328/
増井隆治 評 (日本応用数理学会 2022年12月13日)
https://jsiam.org/online_magazine/book_review/4482/