Мультимодальная архитектура обнаружения
Наша миссия — защитить цифровую экосистему от синтетических манипуляций. ZeroTrue использует ансамбль моделей, ориентированных на доказательства, для обнаружения контента, созданного ИИ, в тексте, коде, голосе, музыке и видео.

Архитектуры по модальностям
Наши специализированные пайплайны разработаны для захвата уникальных артефактов, оставляемых генеративными моделями в каждой области.
2.1 Генерация текста
Технический подход
Гибридные детекторы, сочетающие тесты правдоподобия/перплексии, контролируемые классификаторы (файн-тюнинг RoBERTa/DeBERTa) и стилометрические признаки.
Ключевые техники
2.2 LLM-код
Технический подход
Двухпутевой анализ с использованием контентно-независимых детекторов (признаки AST/CFG) и считывателей водяных знаков с учетом происхождения.
Ключевые техники
2.3 Клонирование голоса / TTS
Технический подход
Спектрограммные модели CNN/Conformer, объединенные с признаками анти-спуфинга LFCC/EFCC и вариантами ECAPA-TDNN.
Ключевые техники
2.4 Генерация музыки
Технический подход
Многомасштабные спектрограммные отпечатки и тембральные/гармонические остатки, объединенные с теоретико-музыкальными признаками.
Ключевые техники
2.5 Дипфейк видео
Технический подход
Пространственно-временные детекторы (Xception/EfficientNet + TimeSformer) с частотными и физиологическими вспомогательными элементами.
Ключевые техники
Наборы данных и протоколы оценки
| Набор данных | Домен | Размер / Примечания | Метрика(и) |
|---|---|---|---|
| HC3 / HC3+ | Текст | Высококачественный ChatGPT vs Человек | AUROC, FPR@TPR |
| RAID | Текст | Состязательные атаки и домены | Оценка устойчивости |
| AIGCodeSet | Код | Задачи генерации Python | AUROC |
| ASVspoof 2019/21 | Аудио | Логический/Физический доступ | EER, min t-DCF |
| ADD 2022 | Аудио | Обнаружение аудиодипфейков | EER |
| DFDC | Видео | 100k+ клипов, при поддержке Facebook | Video-AUC |
| FaceForensics++ | Видео | Различные методы манипуляции | Frame-AUC |
| Celeb-DF | Видео | Высококачественные дипфейки | AUC |
* Мы также отслеживаем GenImage для базовых показателей генерации изображений.
Метрики оценки
Операционные диапазоны
Рекомендуемые пороги действий на основе оценки уверенности.
Происхождение и стандарты
ZeroTrue дополняет статистическое обнаружение криптографическим подтверждением происхождения. Там, где это доступно, мы анализируем и отображаем C2PA Content Credentials наряду с вердиктами наших детекторов. Это обеспечивает двухуровневую защиту: проверку "подлинной" цепочки поставок при статистическом выявлении вероятных манипуляций.
Избранные ссылки
План исследований
Мультимодельная атрибуция
Фингерпринтинг конкретных версий генераторов (например, Midjourney v6 против DALL-E 3).
Слияние с учетом водяных знаков
Интеграция скрытых водяных знаков в оценку уверенности.
Состязательное усиление
Пост-тренировочная устойчивость к новым атакам уклонения.