从ChatGPT中提取训练数据DeepMind研究人员发现了一种新的“发散攻击”（divergence attack）方式，可以诱导ChatGPT疯狂输出其训练数据中的具体内容。研究人员只花了大约 200 美元的token费用，就提取几兆字节的 ChatGPT 训练数据。模型甚至泄露了一些真实电子邮件地址和电话号码。…

发布时间: 2023-11-29 15:50:45

1分

数据加载中

从ChatGPT中提取训练数据
DeepMind研究人员发现了一种新的“发散攻击”（divergence attack）方式，可以诱导ChatGPT疯狂输出其训练数据中的具体内容。
研究人员只花了大约 200 美元的token费用，就提取几兆字节的 ChatGPT 训练数据。
模型甚至泄露了一些真实电子邮件地址和电话号码。…
IT技术
( twitter.com )

从ChatGPT中提取训练数据

DeepMind研究人员发现了一种新的“发散攻击”（divergence attack）方式，可以诱导ChatGPT疯狂输出其训练数据中的具体内容。

研究人员只花了大约 200 美元的token费用，就提取几兆字节的 ChatGPT 训练数据。

模型甚至泄露了一些真实电子邮件地址和电话号码。

这种方式使模型偏离其聊天机器人风格的生成，并以比正常情况下高150倍的频率输出训练数据。

攻击表明，通过查询模型，实际上可以提取它所训练的一些确切数据。估计表明使用此方法，可以从模型中提取约 1 GB 的 ChatGPT 训练数据集。

这种攻击揭示了即使是经过对齐的模型，也可能存在训练数据泄露的风险。

具体步骤：

命令提示：研究人员使用了特定的命令提示，例如重复“poem”这个词。“poem poem poem poem”?”这种重复性的提示使得模型的注意力集中在特定的主题或词汇上。

观察模型响应：在这种重复性提示下，模型倾向于回落到其预训练数据，而不是遵循其微调对齐程序的指导。这意味着模型更可能输出与其训练数据直接相关的内容。

数据泄露频率的增加：在这种攻击下，ChatGPT显示出了高频率地泄露训练数据的情况。这意味着模型在特定的命令提示下，会以远高于正常情况下的频率输出其训练数据中的内容。

攻击后泄露的数据类型包括：

公开数据和私有数据：攻击可能导致泄露大型语言模型（LLM）训练时使用的公开数据和私有数据。这些数据可能包括公司的专有数据收集流程、用户特定数据或未公开的许可数据。

训练数据的具体内容：攻击可能导致泄露训练数据集中的具体内容。例如，论文中提到的一种攻击方法是通过重复特定的令牌序列来诱导模型重现训练数据。这种方法可以用来提取模型训练数据集中的特定文本片段。

个人信息和敏感数据：考虑到大型语言模型通常使用互联网上的广泛文本数据进行训练，因此存在个人信息或敏感数据被泄露的风险。

对ChatGPT的攻击是特定于该模型的，并且据他们所知，不适用于他们测试过的任何其他生产语言模型。他们在发现漏洞后，于8月30日向OpenAI披露了这一漏洞，并在发表论文前允许了90天的时间来解决这个问题。

他们已经与各个模型的作者（如OPT、Falcon、Mistral和LLaMA）分享了他们的发现，并遵循标准的披露时间线。

详细：https://t.co/j4HC7nJk5C
论文：https://t.co/s2BpbNoaEH

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

当地时间4月12日，微软宣布开源DeepSpeed Chat，Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成，具备训练、强化推理等功能，用户只需要通过Deep Speed Chat提供的“傻瓜式”操作，就能以最短的时间、最高效的成本训练类 ChatGPT 大语言模型。
大陆资讯
( mp.weixin.qq.com)

1年前 • 搞鸡啊 • -- 点击 0 评论

闪电预览

EmbedAI：允许你使用自己的数据训练ChatGPT，并将其嵌入到自己的网站、应用中。
- 个性定制：支持在各种数据源上训练ChatGPT，可以通过文件、网站、Notion文档甚至YouTube对ChatGPT进行训练。
-广泛用例：包括智能客服、个性化学习助手、技术支持助手、医疗保健助手和财务聊天机器人等。
-…
IT技术
( twitter.com)

4个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:00:49

【两位作家起诉OpenAI 称ChatGPT侵犯版权】起诉书中提到，美国马萨诸塞州作家保罗·特伦布莱和莫娜·阿瓦德表示，ChatGPT未经他们同意，直接复制了书籍的数据来进行训练，这侵犯了作者的版权。这两位作家称，ChatGPT写出的书籍简要，和他们发表的文章一模一样，这说明训练ChatGPT的数据库包含了他们的作品。
大陆资讯
( wallstreetcn.com)

10个月前 • 观摩团 • -- 点击 0 评论

闪电预览

- 金融领域的 ChatGPT！💰💼

对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统ChatGPT不同，它训练数据包括最新的：…
币圈
( twitter.com)

1年前 • 千寻 • -- 点击 0 评论

- 金融领域的 ChatGPT！💰💼

对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统 ChatGPT 不同，它训练数据包括最新的：…
IT技术
( twitter.com)

11个月前 • 闪电头条⚡️ • -- 点击 0 评论

这下模型训练没有了版权和训练数据顾虑了🤓
微软研究团队最新成果：他们已经开始使用【合成数据】来训练AI模型了。
微软使用大语言模型生成了近100种语言、数十万个文本嵌入任务的“模拟”文本数据，然后用这些数据来训练 AI 。
这大幅度降低了训练成本，提高了效率，同时还减少了模型的偏见。…
IT技术
( twitter.com)

4个月前 • 小互 • -- 点击 0 评论

IT技术

大陆资讯

IT技术

大陆资讯

- 金融领域的 ChatGPT！💰💼

对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统ChatGPT不同，它训练数据包括最新的：…
币圈
( twitter.com)

币圈

- 金融领域的 ChatGPT！💰💼

对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统 ChatGPT 不同，它训练数据包括最新的：…
IT技术
( twitter.com)

IT技术

IT技术

政协委员，央视副召集人张勤提案大模型训练: 如果我们训练的大模型持续用西方价值观数据、西方应用场景来训练中国大模型，中国式的认知将被湮没。…
IT技术
( twitter.com)

IT技术

ChatGPT Plus 官方已正式更新联网查询！
训练数据截止日期：2022.01
联网查询开启路径：Settings - Beta features - Browse with Bing
时政
( twitter.com)

时政

QLoRA 是一种LLM微调的新技术。
- 12小时的单个消费级GPU上训练，性能就可以达到了ChatGPT的97％
- 4bit训练，但是性能与16bit相当
这个数据有点离谱。。
IT技术
( twitter.com)

IT技术

IT技术

大陆资讯

IT技术

大陆资讯

- 金融领域的 ChatGPT！💰💼 对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统ChatGPT不同，它训练数据包括最新的：… 币圈 ( twitter.com)

币圈

- 金融领域的 ChatGPT！💰💼 对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统 ChatGPT 不同，它训练数据包括最新的：… IT技术 ( twitter.com)

IT技术

IT技术

政协委员，央视副召集人张勤提案大模型训练: 如果我们训练的大模型持续用西方价值观数据、西方应用场景来训练中国大模型，中国式的认知将被湮没。… IT技术 ( twitter.com)

IT技术

ChatGPT Plus 官方已正式更新联网查询！ 训练数据截止日期：2022.01 联网查询开启路径：Settings - Beta features - Browse with Bing 时政 ( twitter.com)

时政

QLoRA 是一种LLM微调的新技术。 - 12小时的单个消费级GPU上训练，性能就可以达到了ChatGPT的97％ - 4bit训练，但是性能与16bit相当 这个数据有点离谱。。 IT技术 ( twitter.com)

IT技术

创建一个新帐户

登录

- 金融领域的 ChatGPT！💰💼

对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统ChatGPT不同，它训练数据包括最新的：…
币圈
( twitter.com)

- 金融领域的 ChatGPT！💰💼

对于看一家公司的财务分析太方便了，它提供了 750多家公司和 100+ 位超级投资者信息，与传统 ChatGPT 不同，它训练数据包括最新的：…
IT技术
( twitter.com)

政协委员，央视副召集人张勤提案大模型训练: 如果我们训练的大模型持续用西方价值观数据、西方应用场景来训练中国大模型，中国式的认知将被湮没。…
IT技术
( twitter.com)

ChatGPT Plus 官方已正式更新联网查询！
训练数据截止日期：2022.01
联网查询开启路径：Settings - Beta features - Browse with Bing
时政
( twitter.com)

QLoRA 是一种LLM微调的新技术。
- 12小时的单个消费级GPU上训练，性能就可以达到了ChatGPT的97％
- 4bit训练，但是性能与16bit相当
这个数据有点离谱。。
IT技术
( twitter.com)