模型与研究

多模态检测架构

我们的使命是保护数字生态系统免受合成篡改。ZeroTrue 采用证据优先的集成模型,检测文本、代码、语音、音乐和视频中的 AI 生成内容。

ZeroTrue Architecture Diagram
文本
代码
语音/TTS
音乐
视频

按模态划分的架构

我们的专用管道旨在捕获每个领域中生成模型留下的独特伪影。

2.1 生成文本

技术方法

混合检测器,结合似然度/困惑度测试、监督分类器(RoBERTa/DeBERTa 微调)和文体特征。

关键技术

Token 排名直方图熵峰值突发性功能词比例
指标AUROC, AUPRC, 1%/2% FPR 下的 TPR
可解释性Token 级热力图,FPR@TPR 阈值带。
基准HC3/HC3+, RAID 鲁棒性套件

2.2 LLM 生成代码

技术方法

双轨分析,使用内容无关检测器(AST/CFG 特征)和来源感知水印读取器。

关键技术

GraphCodeBERT 基线梯度提升文体学标识符熵
指标AUROC, TPR@FPR≤5%, 编辑鲁棒性
可解释性通过审查员 LLM 的异常理由。
基准AIGCodeSet, ACL/AAAI 研究

2.3 语音克隆 / TTS

技术方法

频谱级 CNN/Conformer 模型,融合 LFCC/EFCC 反欺诈特征和 ECAPA-TDNN 变体。

关键技术

重放增强编解码器模拟rPPG 同步(当存在视频时)
指标EER, 最小 t-DCF
可解释性频谱异常区域。
基准ASVspoof 2019/2021 (LA/PA/DF), ADD 2022, FakeAVCeleb

2.4 生成音乐

技术方法

多尺度频谱指纹和音色/和声残差,结合音乐理论特征。

关键技术

调性稳定性分析N-gram 和弦进行VQ-VAE 伪影检测
指标AUROC, 片段一致性
可解释性音色一致性评分。
基准内部数据集 (OpenAI Jukebox, Suno, Udio)

2.5 深度伪造视频

技术方法

时空检测器(Xception/EfficientNet + TimeSformer),带有频率和生理辅助特征。

关键技术

眨眼检测rPPG 脉搏提取逐帧分析
指标视频 AUC, 帧 AUC, 跨数据集泛化
可解释性时间热力图,人脸裁剪置信度。
基准DFDC, FaceForensics++, Celeb-DF, DeeperForensics-1.0

数据集与评估协议

数据集领域规模 / 备注指标
HC3 / HC3+文本高质量 ChatGPT vs 人类AUROC, FPR@TPR
RAID文本对抗性攻击与领域鲁棒性评分
AIGCodeSet代码Python 生成任务AUROC
ASVspoof 2019/21音频逻辑/物理访问EER, 最小 t-DCF
ADD 2022音频音频深度伪造检测EER
DFDC视频10万+ 片段,Facebook 支持视频 AUC
FaceForensics++视频多样化篡改方法帧 AUC
Celeb-DF视频高质量深度伪造AUC

* 我们也追踪 GenImage 以获取图像生成基线。

评估指标

文本
AUROC
TPR @ 1% FPR
代码
AUROC
TPR @ 5% FPR
音频
EER
最小 t-DCF
视频
视频 AUC
帧 AUC

操作区间

基于置信度评分的推荐行动阈值。

0-20% (安全)
20-50% (审查)
50-100% (高概率)

来源与标准

ZeroTrue 用加密来源补充统计检测。如果可用,我们会解析并显示 C2PA Content Credentials 以及我们的检测器结论。这提供了双层防御:在统计标记可能的篡改的同时验证"真实"的监管链。

C2PA 验证
水印读取
已签名
来源清单
C2PA
内容凭证
由相机制造商签名

研究路线图

Q3 2025

多模型归因

识别特定生成器版本(例如 Midjourney v6 vs DALL-E 3)。

Q4 2025

水印感知融合

将隐藏水印集成到置信度评分中。

Q1 2026

对抗性加固

针对新逃避攻击的后训练鲁棒性。