近日,兰州大学数学与统计学院2025级硕士研究生徐嘉德与其导师李周平教授合作完成的论文《LORD-GoF: A Robust Online Detection Approach for LLM Watermarks in Sparse and Mixed Streams》被人工智能与机器学习领域顶级会议 International Conference on Machine Learning (ICML) 接收发表。
随着大语言模型的快速发展,自然语言生成能力显著提升,但机器生成文本与人工撰写文本的区分也愈发困难。文本水印技术通过在模型生成过程中嵌入统计信号,为识别AI生成内容提供了重要工具。然而在实际应用中,文本常以连续数据流形式出现,其中机器生成内容通常较为稀疏,且可能与人工修改内容混合。传统离线检测方法在此类场景下容易累积误判风险,难以满足长期在线监测的可靠性要求。
针对这一问题,该研究提出了LORD-GoF在线检测框架。该框架将文本水印检测的统计检验方法与在线错误发现率控制机制相结合,使检测阈值能够根据历史检测结果动态调整,从而在流式文本场景中兼顾检测能力与误判控制。图1展示了本研究提出的从文本流输入、统计检验到在线阈值分配的整体流程。

图1 LORD-GoF 在线水印检测框架示意图
与传统固定阈值检测方法相比,该研究更关注真实部署场景中的稀疏性、混合性和连续决策问题。论文从理论上证明了所提方法能在一定条件下控制在线错误发现率,并通过多组实验验证了该框架在不同模型、水印方案和流式数据设置下的稳健性。实验结果表明,该方法在保持较强检测能力的同时,能有效缓解静态检测方法在稀疏流式场景中的错误率膨胀问题。
论文链接:https://icml.cc/virtual/2026/poster/61558