📊 Публичная статистика точности
Мы публикуем собственные метрики эффективности, чтобы вы сами решали, доверять ли системе.
Статистики пока нет. Calibration cron ещё не разрешил достаточно сценариев.
Как мы измеряем точность
- Brier Score — средняя квадратичная ошибка между предсказанной вероятностью и фактическим исходом. Диапазон 0–1, ниже — лучше. Coin-flip = 0.25.
- ROC-AUC — площадь под ROC-кривой. 1.0 — идеальное разделение, 0.5 — случайное.
- Калибровка — для бинов по вероятности фактическая частота должна совпадать. Например, предсказания 70% должны сбываться в ~70% случаев.
Неверные предсказания автоматически снижают вес рёбер в графе знаний — система учится на собственных ошибках. Статистика на этой странице пересчитывается еженедельно сервисом калибровки.