
作者:[美]张致恩,庄镝,[斯里兰卡]杜明杜·萨马拉维拉
页数:244
出版社:东南大学出版社
出版日期:2024
ISBN:9787576609455
高清校对版pdf(带目录)
前往页尾底部查看PDF电子书
内容简介
本书通过面部识别、云数据存储等真实世界中的用例来探讨隐私保护技术。你将了解到现在就可以部署的切实有效的实施方法、未来的隐私挑战以及如何调整现有技术以满足你的需求。你所学到的新技能将会在最后一章用来建立一个完整的安全数据平台项目。
作者简介
张致恩(J.MORRIS CHANG),自2016年起担任南佛罗里达大学电气工程系教授,他曾在艾奥瓦州立大学(2001-2016)、伊利诺伊理工大学(1995-2001)和罗切斯特理工大学(1993-1995)任教。在进入学术界之前,他曾在AT&T贝尔实验室担任计算机工程师(1988-1990)。他最近的研究工作涵盖了广泛的网络安全领域,包括认证、恶意软件检测、隐私增强技术、机器学习中的安全性,并得到了美国国防部不同机构的资助。Chang博士在北卡罗来纳州立大学获得计算机工程博士学位,他于1999年获得伊利诺伊理工大学卓越教学奖,并于2019年入选北卡罗来纳州立大学ECE校友名人堂。在过去的10年里,他一直担任由DoD机构资助的各种项目的首席研究员。Morris在学术期刊和会议上发表了超过196篇论文,此外,他还曾在电气和电子工程师协会担任过各种职位。
庄镝,Snap Inc.的一名安全工程师,他获得了中国天津南开大学的信息安全学士学位和法律学士学位,以及南佛罗里达大学的电气工程博士学位。他是一位精力充沛、技术精湛的安全和隐私研究者,对隐私设计、差分隐私、隐私保护机器学习、社交网络科学和网络安全方面很感兴趣,并拥有很多相关的专业知识和经验。2015年至2018年,他在DARPA的Brandeis项目下进行隐私保护机器学习研究。
杜明杜·萨马拉维拉(DUMINDU SAMARAWEERA),南佛罗里达大学的研究助理教授,他获得了澳大利亚科廷大学计算机系统和网络学士学位、斯里兰卡信息技术大学的信息技术学士学位以及英国谢菲尔德哈勒姆大学的企业应用开发硕士学位。他在南佛罗里达大学获得了电气工程博士学位,专注于研究网络安全和数据科学。他的博士论文《深度学习时代的安全和隐私增强技术》解决了当今数据驱动的应用的隐私和安全问题,并为缓解此类问题提出了深入详细的解决方案。多年来,他参与了多个由美国国防部资助的大型网络安全研究项目。在加入USF之前,他在该行业担任软件工程师/电气工程师超过6年,同时管理和部署企业级解决方案。
马学彬,博士,内蒙古大学计算机学院副教授,硕士生导师。2009年1月毕业于东北大学计算机应用技术专业,获工学博士学位。目前为中国计算机学会大数据专家委员会通讯委员、中国保密协会隐私保护专业委员会委员、ACM呼和浩特分会理事、内蒙古自治区大数据与云计算标准委员会特聘专家委员。主要研究方向为隐私保护技术、联邦学习、无线网络路由技术、延迟容忍网络等。
目录
第1章 机器学习中的隐私问题
1.1 人工智能时代的隐私问题
1.2 超出预期目的的学习威胁
1.2.1 随时使用隐私数据
1.2.2 ML算法中的数据处理方式
1.2.3 为什么ML中的隐私保护很重要
1.2.4 监管要求和可用性与隐私权衡
1.3 ML系统的威胁和攻击
1.3.1 明文隐私数据的问题
1.3.2 重构攻击
1.3.3 模型反演攻击
1.3.4 成员推理攻击
1.3.5 去匿名化或重识别攻击
1.3.6 大数据分析中隐私保护面临的挑战
1.4 在从数据中学习的同时确保隐私——保护隐私的机器学习技术
1.4.1 差分隐私的使用
1.4.2 本地化差分隐私
1.4.3 隐私保护的合成数据生成
1.4.4 隐私保护数据挖掘技术
1.4.5 压缩隐私
1.5 本书是怎样的结构?
第2章 机器学习中的差分隐私
2.1 什么是差分隐私?
2.1.1 差分隐私的概念
2.1.2 差分隐私的工作原理
2.2 差分隐私机制
2.2.1 二元机制(随机响应)
2.2.2 拉普拉斯机制
2.2.3 指数机制
2.3 差分隐私的特性
2.3.1 差分隐私的后处理特性
2.3.2 差分隐私的群组隐私特性
2.3.3 差分隐私的组合特性
第3章 机器学习中差分隐私的高级概念
3.1 在机器学习中应用差分隐私
3.1.1 输入扰动
3.1.2 算法扰动
3.1.3 输出扰动
3.1.4 目标扰动
3.2 差分隐私监督学习算法
3.2.1 差分隐私朴素贝叶斯分类
3.2.2 差分隐私逻辑回归
3.2.3 差分隐私线性回归
3.3 差分隐私无监督学习算法
差分隐私k-means聚类
3.4 案例研究——差分隐私主成分分析
3.4.1 横向分割数据上PCA的隐私
3.4.2 在横向分割的数据上设计差分隐私PCA
3.4.3 通过实验评估协议的性能
第二部分 本地化差分隐私和合成数据生成
第4章 本地化差分隐私机器学习
4.1 什么是本地化差分隐私?
4.1.1 本地化差分隐私的概念
4.1.2 用于本地化差分隐私的随机响应
4.2 本地化差分隐私机制
4.2.1 直接编码
4.2.2 直方图编码
4.2.3 一元编码
第5章 机器学习中的高级LDP机制
5.1 本地化差分隐私的快速回顾
5.2 高级LDP机制
5.2.1 LDP中的拉普拉斯机制
5.2.2 LDP的Duchi机制
5.2.3 LDP的Piecewise机制
5.3 一个实现LDP朴素贝叶斯分类的案例研究
5.3.1 使用朴素贝叶斯和ML分类
5.3.2 使用具有离散特征的LDP朴素贝叶斯
5.3.3 使用具有连续特征的LDP朴素贝叶斯
5.3.4 评估不同的LDP协议的性能表现
第6章 隐私保护合成数据的生成
6.1 合成数据生成概述
6.1.1 什么是合成数据?它为何重要?
6.1.2 在应用方面使用合成数据进行隐私保护
6.1.3 生成合成数据
6.2 通过数据匿名化保护隐私
6.2.1 隐私信息共享与隐私问题
6.2.2 使用k-anonymity对抗重识别攻击
6.2.3 k-anonymity之外的匿名化
6.3 用于生成隐私保护合成数据的DP
6.3.1 DP合成直方图表示的生成
6.3.2 DP合成表格数据生成
6.3.3 DP多边缘合成数据生成
6.4 通过特征级微聚合发布隐私合成数据的案例研究
6.4.1 使用层次聚类和微聚合
6.4.2 生成合成数据
6.4.3 评估生成的合成数据的性能
第三部分 构建具有隐私保障的机器学习应用
第7章 隐私保护数据挖掘技术
7.1 隐私保护在数据挖掘和管理中的重要性
7.2 数据处理和挖掘过程中的隐私保护
7.2.1 什么是数据挖掘?如何使用数据挖掘?
7.2.2 隐私监管要求的重要性
7.3 通过修改输入来保护隐私
应用和限制
7.4 在发布数据时保护隐私
7.4.1 在Python中实现数据清洗操作
7.4.2 k-anonymity
7.4.3 在Python中实现k-anonymity
第8章 隐私保护数据管理和操作
8.1 快速回顾数据处理和挖掘中的隐私保护
8.2 k-anonymity之外的隐私保护
8.2.1 l-diversity
8.2.2 t-closeness
8.2.3 用Python实现隐私模型
8.3 通过修改数据挖掘的输出保护隐私
8.3.1 关联规则隐藏
8.3.2 降低数据挖掘操作的准确度
8.3.3 统计数据库中的推理控制
8.4 数据管理系统中的隐私保护
8.4.1 数据库安全和隐私:威胁和漏洞
8.4.2 砚代数据库系统泄露隐私信息的可能性有多大?
8.4.3 对数据库系统的攻击
8.4.4 统计数据库系统中的隐私保护技术
8.4.5 设计可定制的隐私保护数据库系统时应考虑什么
第9章 机器学习中的压缩隐私
9.1 压缩隐私介绍
9.2 压缩隐私的机制
9.2.1 主成分分析(PCA)
9.2.2 其他降维方法
9.3 在ML应用中使用压缩隐私
9.3.1 实现压缩隐私
9.3.2 效用任务的准确度
9.3.3 在DCA中ρ'对隐私和可用性的影响
9.4 案例研究:横向分割数据的隐私保护PCA和DCA
9.4.1 实现横向分割数据的隐私保护
9.4.2 简要回顾降维方法
9.4.3 使用加法同态加密
9.4.4 方法概述
9.4.5 隐私保护计算的工作原理
9.4.6 评估隐私保护PCA和DCA的效率和准确度
第10章 整体设计:构建一个隐私增强平台(DataHub)
10.1 研究数据保护和共享平台的重要性
10.1.1 DataHub平台背后的动机
10.1.2 DataHub的重要特性
10.2 理解研究协同工作区
10.2.1 架构设计
10.2.2 融合不同的信任模型
10.2.3 配置访问控制机制
10.3 将隐私和安全技术集成到DataHub
10.3.1 使用基于云的安全NoSQL数据库进行数据存储
10.3.2 本地化差分隐私的隐私保护数据收集
10.3.3 隐私保护机器学习
10.3.4 隐私保护查询处理
10.3.5 在DataHub平台中使用合成数据生成
附录 关于差分隐私的更多详细信息
A.1 差分隐私的正式定义
A.2 其他差分隐私机制
A.2.1 几何机制
A.2.2 高斯机制
A.2.3 阶梯机制
A.2.4 向量机制
A.2.5 Wishart机制
A.3 差分隐私组合特性的形式化定义
A.3.1 DP串行组合的形式化定义
A.3.2 并行组合DP的形式化定义
参考文献
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.xiazainiu.com/Wd1qk_5_23975.html