基于语义的鲁棒文本水印算法
文本水印算法能够确定文本数据的版权归属,进而促进数据安全流通和共享。现有文本水印算法通常预先对原始文本中的词汇进行标记并采用词汇替换的方法来注入水印。然而,这些算法仅基于原始文本词汇的前一个词汇的哈希值来标记当前词汇,限制了水印算法的鲁棒性。为了解决这一问题,提出了SRTW算法。具体而言,SRTW算法首先利用现有的嵌入模型获取文本语义嵌入;其次,通过训练的词汇标记模型将这些文本语义嵌入转换为词汇标记(-1或1);最后,选择标记为1的词汇替换原词汇来注入水印。与现有的较先进的基准方法相比,提出的SRTW算法在3种不同攻击场景下AUC指标分别提高了2.08%、5.17%和3.09%,充分证明了SR...
Saved in:
Published in | 大数据 Vol. 10; no. 6; pp. 49 - 61 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
人民邮电出版社有限公司
15.11.2024
合肥综合性国家科学中心数据空间研究院,安徽 合肥 230088 合肥工业大学计算机与信息学院,安徽 合肥 230029%安徽大学人工智能学院,安徽 合肥 230601%合肥综合性国家科学中心数据空间研究院,安徽 合肥 230088%合肥工业大学计算机与信息学院,安徽 合肥 230029 |
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 文本水印算法能够确定文本数据的版权归属,进而促进数据安全流通和共享。现有文本水印算法通常预先对原始文本中的词汇进行标记并采用词汇替换的方法来注入水印。然而,这些算法仅基于原始文本词汇的前一个词汇的哈希值来标记当前词汇,限制了水印算法的鲁棒性。为了解决这一问题,提出了SRTW算法。具体而言,SRTW算法首先利用现有的嵌入模型获取文本语义嵌入;其次,通过训练的词汇标记模型将这些文本语义嵌入转换为词汇标记(-1或1);最后,选择标记为1的词汇替换原词汇来注入水印。与现有的较先进的基准方法相比,提出的SRTW算法在3种不同攻击场景下AUC指标分别提高了2.08%、5.17%和3.09%,充分证明了SRTW算法的有效性。 |
---|---|
ISSN: | 2096-0271 |
DOI: | 10.11959/j.issn.2096-0271.2024068 |