模型与研究
多模态检测架构
我们的使命是保护数字生态系统免受合成篡改。ZeroTrue 采用证据优先的集成模型,检测文本、代码、语音、音乐和视频中的 AI 生成内容。

文本代码语音/TTS音乐视频
按模态划分的架构
我们的专用管道旨在捕获每个领域中生成模型留下的独特伪影。
2.1 生成文本
技术方法
混合检测器,结合似然度/困惑度测试、监督分类器(RoBERTa/DeBERTa 微调)和文体特征。
关键技术
Token 排名直方图熵峰值突发性功能词比例
指标AUROC, AUPRC, 1%/2% FPR 下的 TPR
可解释性Token 级热力图,FPR@TPR 阈值带。
基准HC3/HC3+, RAID 鲁棒性套件
2.2 LLM 生成代码
技术方法
双轨分析,使用内容无关检测器(AST/CFG 特征)和来源感知水印读取器。
关键技术
GraphCodeBERT 基线梯度提升文体学标识符熵
指标AUROC, TPR@FPR≤5%, 编辑鲁棒性
可解释性通过审查员 LLM 的异常理由。
基准AIGCodeSet, ACL/AAAI 研究
2.3 语音克隆 / TTS
技术方法
频谱级 CNN/Conformer 模型,融合 LFCC/EFCC 反欺诈特征和 ECAPA-TDNN 变体。
关键技术
重放增强编解码器模拟rPPG 同步(当存在视频时)
指标EER, 最小 t-DCF
可解释性频谱异常区域。
基准ASVspoof 2019/2021 (LA/PA/DF), ADD 2022, FakeAVCeleb
2.4 生成音乐
技术方法
多尺度频谱指纹和音色/和声残差,结合音乐理论特征。
关键技术
调性稳定性分析N-gram 和弦进行VQ-VAE 伪影检测
指标AUROC, 片段一致性
可解释性音色一致性评分。
基准内部数据集 (OpenAI Jukebox, Suno, Udio)
2.5 深度伪造视频
技术方法
时空检测器(Xception/EfficientNet + TimeSformer),带有频率和生理辅助特征。
关键技术
眨眼检测rPPG 脉搏提取逐帧分析
指标视频 AUC, 帧 AUC, 跨数据集泛化
可解释性时间热力图,人脸裁剪置信度。
基准DFDC, FaceForensics++, Celeb-DF, DeeperForensics-1.0
数据集与评估协议
| 数据集 | 领域 | 规模 / 备注 | 指标 |
|---|---|---|---|
| HC3 / HC3+ | 文本 | 高质量 ChatGPT vs 人类 | AUROC, FPR@TPR |
| RAID | 文本 | 对抗性攻击与领域 | 鲁棒性评分 |
| AIGCodeSet | 代码 | Python 生成任务 | AUROC |
| ASVspoof 2019/21 | 音频 | 逻辑/物理访问 | EER, 最小 t-DCF |
| ADD 2022 | 音频 | 音频深度伪造检测 | EER |
| DFDC | 视频 | 10万+ 片段,Facebook 支持 | 视频 AUC |
| FaceForensics++ | 视频 | 多样化篡改方法 | 帧 AUC |
| Celeb-DF | 视频 | 高质量深度伪造 | AUC |
* 我们也追踪 GenImage 以获取图像生成基线。
评估指标
文本
AUROC
TPR @ 1% FPR
代码
AUROC
TPR @ 5% FPR
音频
EER
最小 t-DCF
视频
视频 AUC
帧 AUC
操作区间
基于置信度评分的推荐行动阈值。
0-20% (安全)
20-50% (审查)
50-100% (高概率)
来源与标准
ZeroTrue 用加密来源补充统计检测。如果可用,我们会解析并显示 C2PA Content Credentials 以及我们的检测器结论。这提供了双层防御:在统计标记可能的篡改的同时验证"真实"的监管链。
C2PA 验证
水印读取
已签名
来源清单
内容凭证
由相机制造商签名
精选参考文献
研究路线图
Q3 2025
多模型归因
识别特定生成器版本(例如 Midjourney v6 vs DALL-E 3)。
Q4 2025
水印感知融合
将隐藏水印集成到置信度评分中。
Q1 2026
对抗性加固
针对新逃避攻击的后训练鲁棒性。