透明性能

基准测试与滚动指标

在野外数据上按季度滚动评估。诚实指标、透明方法和持续改进。

94%+
Accuracy
<2s
Avg Latency
<3%
False Positive
92%+
Recall

方法论

我们如何在野外评估性能

数据集

  • • In-the-wild dataset
  • • Adversarial samples
  • • Compression variants
  • • Cross-platform tests

评估

  • • Quarterly rolling eval
  • • Blind test sets
  • • Human baseline
  • • A/B testing

报告

  • • Per-modality metrics
  • • Confidence calibration
  • • Error analysis
  • • False positive tracking

真实世界泛化

压缩鲁棒性

在社交媒体和消息应用中常见的高度压缩内容上评估

新型生成器处理

随着新 AI 模型和生成技术的出现进行测试

对抗弹性

持续评估反检测技术和混淆方法