论文发表在nature上:
https://www.nature.com/articles/s41586-024-08025-4
他说调整了选词概率,可以在模型输出的时候在不增加成本的情况下增加这个水印
使用 LLM 生成文本通常是自回归的:LLM 将概率分配给词汇表中的元素(标记),然后根据迄今为止生成的文本,按照这些概率采样,选择下一个标记(图 1,上)。生成式水印(图 1,下部)通过仔细修改下一个标记的采样程序,在生成的文本分布中注入微妙的、特定于上下文的修改。这种修改会在生成的文本中引入统计签名;在水印检测阶段,可以通过测量签名来确定文本是否确实是由水印 LLM 生成的。这种方法的一个主要优点是,检测过程不需要执行计算昂贵的操作,甚至不需要访问底层 LLM(通常是专有的)。
