从水印技术在ChatGPT上开始应用说起-专题报道-闪捷信息科技有限公司

从水印技术在ChatGPT上开始应用说起

2023-03-23 14:41

What's ChatGPT

好了，读到这里小编相信你已经大概知道什么是ChatGPT了。自OpenAI 在去年底正式推出聊天机器人ChatGPT以来，这个披着AI皮的打工人杀手，已经光速火遍全网。学生们已经开始用它作弊、新闻网站开始用ChatGPT写文章，就连小编我也得用着ChatGPT上岗。但这无疑带来了新的数据安全问题。面对无数使用ChatGPT作弊和偷懒的人，作为监管应该如何知晓呢？

其实，答案我们从一开始就告诉了大家。没错，那就是：水印技术。

ChatGPT中使用的水印技术

近日，来自马里兰大学的几位研究者针对 ChatGPT 等语言模型输出的水印进行了深入研究。他们提出了一种新的模型水印算法，能够准确判断文本到底是谁写的。无需访问模型参数、API，结果置信度高达99.999999999994%。

所谓模型水印，人类无法看到，但是计算机可以。

这是一种现在被常用于大规模语言模型（LLM）中的方法，能让AI生成的文本带有“特殊标记”。即把信号嵌入到生成的文本中，让算法能从一小段token中检测出来。

具体来说，大规模语言模型每次生成一个token，每个token将从包含大约5万个词汇的词汇表中进行选择。在新token生成之前，该方法会从基于最近已生成的token为随机数生成器（RNG）提供“种子”，以此来压一个水印。

然后使用RNG，能将词汇表分为黑名单和白名单，并要求LLM接下来只能从白名单中选择词汇。如果整段文本中，白名单中的词汇越多，就意味着越有可能是AI生成的。

黑白名单的区分，基于一个原则：

人类使用词汇的随机性更强。

举例来说，如果在“美丽的”后面生成词汇，水印算法会将“花”列入白名单，将“兰花”列入黑名单。论文作者认为，AI更可能使用“花”这个词汇，而不是“兰花”。

然后，就能通过计算整段文本中白名单token出现的情况，来检测水印。如果一共有生成了N个token，所有的token都使用了白名单词汇，那么这段文字只有2的N次方分之一概率是人类写的。即便这段文字只有25个词组成，那么水印算法也能判断出它到底是不是AI生成的。

以下面这段话为例：

这段文字由人类写出的概率，仅有0.0000000000006% （6乘以10的-15次方）。

当然，研究者随后也表示了，这种方法存在一定的局限性。不过这项技术仍然是目前判断内容是否出自ChatGPT的最佳解决方案之一。

现阶段的水印技术

水印技术本质是一种在业务无感知的前提下，有效溯源威胁的数据安全技术。其核心也在于这两点：

一、如何无感知的添加水印，

二、如何准确的复原水印信息。

不得不说，ChatGPT对水印技术的介绍还是到位的，可能在那段描述里就包含了不少水印信息。随着数据安全行业的发展，水印技术目前在各行各业都有广泛应用。针对不同使用场景，水印技术的实现方式也有很大差别。总体来说，水印技术的应用可以分为非结构化数据和结构化数据两种场景。

针对非结构化的文档类数据，数据水印一般利用信息隐写、隐藏通道、图层叠加、冗余计算等技术对原始文档/图片进行修改。同时与终端管控技术相结合，支持对屏幕截屏、录屏、打印、扫描等数据行为进行实时水印嵌入和溯源。

目前，该技术主要应用于文档类安全产品，例如数据防泄漏(DLP)产品上。

而针对结构化的数据库表类数据，目前则主要是伪行、伪列、无痕、脱敏四种水印技术在数据表中插入水印信息。

以伪行的嵌入为例：对每个生成的仿真元组做哈希运算，公式如下：

Hash=Hash(K, x, Pi) mod (N+N’)

其中，K为密钥，x为待插入的伪元组，Pi为该伪元组的主键值，N为原始数据库的元组数，N’为伪元组数。将伪元组随机插入到Hash值所在的行。嵌入的伪元组值，用户要存储在安全的地方，方便水印提取时做比对使用。

目前，该技术主要应用于数据库安全类产品，例如数据库水印、大数据安全网关等产品中。

至于前文中针对ChatGPT所用到的水印技术，应该也属于非结构化数据的场景，但是其实现的技术的确比较新颖，对现有的水印技术应该具有一定的启发。

结语

水印技术是数据安全技术体系中非常重要的一项，对数据泄漏人员的威慑力不容小觑。但水印技术与业务强绑定的原因，导致水印产品的标准化程度并不高。这并非水印技术本身的问题，反而是我们数据安全行业将欲攻克之难关。ChatGPT的火热预示着数字时代进入了新的阶段，欢迎各位与闪捷信息一起，见证数据安全的发展与变革。

关于闪捷信息：

闪捷信息（Secsmart）是一家专注数据安全的高新技术企业，创新性提出“云·管·端”立体化动态数据安全理念，在业界率先将人工智能、前沿密码技术成功应用于数据安全领域，实现对结构化和非结构化数据资产的全面防护。产品范围涉及大数据安全、云数据安全、应用数据安全、数据防泄漏、工业互联网安全、数据安全治理以及数据安全治理服务等，已广泛应用于政府、电力、金融、运营商、医疗、教育等行业。

上一篇：数字中国时代，如何筑牢数字安全屏障？

下一篇：【中国网】2020数据安全高峰论坛圆满落幕

从水印技术在ChatGPT上开始应用说起

试用申请