Python中文
首页
教程
问答
标签
搜索
登录
注册
局部差分隐私实现的广义随机响应
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我的任务是实现本地(非交互式)差异隐私机制。我正在处理一个庞大的人口普查数据数据库。唯一敏感的属性是“子女数”,它是一个从0到13的数值。在</p> <p>我决定采用广义随机响应机制,因为它似乎是最直观的方法。这个机制被描述为<a href="https://arxiv.org/pdf/1705.04421.pdf" rel="nofollow noreferrer">here</a>和{a2}。在</p> <p>在将每个值加载到一个数组中之后(暂时忽略其他属性),我执行如下扰动。在</p> <pre><code>d = 14 # values may range from 0 to 13 eps = 1 # epsilon level of privacy p = (math.exp(eps)/(math.exp(eps)+d-1)) q = 1/(math.exp(eps)+d-1) p_dataset = [] for row in dataset: coin = random.random() if coin <= p: p_dataset.append(row) else: p_dataset.append(random.randint(0,13)) </code></pre> <p>除非我误解了这个定义,否则我相信这将保证p峎u数据集上的epsilon差异隐私。在</p> <p>但是,我很难理解聚合器必须如何解释这个数据集。在上面的<a href="https://youtu.be/k-KfUuS0lWE?t=520" rel="nofollow noreferrer">presentation</a>之后,我尝试实现一个方法来估计回答特定值的个人数量。在</p> ^{pr2}$ <p>我不知道我是否正确地实现了所描述的方法,因为我不完全理解它在做什么,也找不到一个清晰的定义。在</p> <p>不管怎样,我使用这个方法来估计数据集中的epsilon值从1到14回答每个值的个人总数,然后将其与实际值进行比较。结果如下(请原谅格式化)。在</p> <p><a href="https://i.stack.imgur.com/RE3H5.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/RE3H5.png" alt="Results of estimation"/></a></p> <p>如您所见,epsilon值较低时,数据集的实用程序会受到很大影响。此外,当多次执行时,即使是小量epsilon值,估计值的偏差也相对较小。在</p> <p>例如,当估计回答0的参与者数量时,使用epsilon为1,所有的估计值似乎都集中在1600左右,估计值之间的最大距离是100。考虑到这个查询的实际值是5969,我认为我可能实现了错误的东西。在</p> <p>这是广义随机响应机制的预期行为,还是我在实现中犯了错误?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我认为当得到错误答案时,我们不能直接使用<code>p_dataset.append(random.randint(0,13))</code>,因为它包含真答案</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
我是否正确构建了这个递归神经网络
3 回答
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
9 回答
我是否正确理解Keras中的批次大小?
10 回答
我是否正确理解PyTorch的加法和乘法?
2 回答
我是否正确组织了我的Django应用程序?
9 回答
我是否正确计算执行时间?如果是这样,那么并行处理将花费更长的时间。这看起来很奇怪
8 回答
我是否每次创建新项目时都必须在PyCharm中安装numpy?(安装而不是导入)
8 回答
我是否每次运行jupyter笔记本时都必须重新启动内核?
2 回答
我是否用python安装了socks模块?
7 回答
我是否真的需要知道超过一种语言,如果我想要制作网页应用程序?
10 回答
我是否缺少spaCy柠檬化中的预处理功能?
5 回答
我是否缺少给定状态下操作的检查?
10 回答
我是否能够使用函数“count()”来查找密码中大写字母的数量((Python)
3 回答
我是否能够使用用户输入作为colorama模块中的颜色?
5 回答
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户?
2 回答
我是否能够将来自多个不同网站的数据合并到一个csv文件中?
6 回答
我是否能够将目录路径转换为可以输入python hdf5数据表的内容?
2 回答
我是否能够等到一个对象被销毁,直到它创建另一个对象,然后在循环中运行time.sleep()
4 回答
我是否能够通过CBV创建用户实例,而不是首先创建表单?(Django)
9 回答
我是否要使它成为递归函数?
2 回答