ぱらぱらめくる『データ匿名化手法』
- 作者: Khaled El Emam,Luk Arbuckle,木村映善,魔狸,笹井崇司
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/05/23
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (8件) を見る
- 目次
- 1章
- 匿名化(anonymization)、マスキング、非特定化(de-identification)
- ヒューリスティクス、リスクベースアプローチ
- 差別
- 2章 リスクベースの比特定化方法論
- 3章 横断的データ
- 4章 縦断的な退院時要約データ
- 6章 縦断的イベントデータ
- 長期間にわたって特異度が上がる情報だけれど、そのすべてについて完全な知識を持って攻撃するとは考えなくてもよい。攻撃者がどれくらい不完全な知識を有していると考えるか、それがどれくらいの攻撃力に相当するのか、というような見積もりをする
- 7章 データリダクション
- 大規模かつ複雑なデータセットに従来型の非特定化をすると、情報損失が大きくなるので、情報損失を抑えつつ、プライバシー保護するための工夫がなされている
- サブサンプリングが有効なことがある(有効でないこともある)
- 9章 自由形式のテキスト
- テキスト内の個人情報要素を検出すること自体が問題。検出した後で、それをマスクするなり、それに基づいて上述の手法に基づく処理をするなりするわけだが、その元が問題
- 9章 地理空間の集約
- クロッピング
- 隠しながらも、相互の位置関係の情報は失いたくない
- -
- 10章 医療分野におけるコード群
- コード
- 国際疾病分類ICD
- 医療通用手技用語集CPT
- 全米医薬品コードNDC
- シャッフリング
- コード
- 11章 マスキング
- フィールド秘匿
- ランダム化
- 仮名化
- 動的マスキング
- 12章 セキュアな連結
- 13章 非特定化とデータ品質
- 情報損失・有用性