📊 Публичная статистика точности

Мы публикуем собственные метрики эффективности, чтобы вы сами решали, доверять ли системе.

Статистики пока нет. Calibration cron ещё не разрешил достаточно сценариев.

Как мы измеряем точность

  • Brier Score — средняя квадратичная ошибка между предсказанной вероятностью и фактическим исходом. Диапазон 0–1, ниже — лучше. Coin-flip = 0.25.
  • ROC-AUC — площадь под ROC-кривой. 1.0 — идеальное разделение, 0.5 — случайное.
  • Калибровка — для бинов по вероятности фактическая частота должна совпадать. Например, предсказания 70% должны сбываться в ~70% случаев.

Неверные предсказания автоматически снижают вес рёбер в графе знаний — система учится на собственных ошибках. Статистика на этой странице пересчитывается еженедельно сервисом калибровки.