Перейти к основному содержимому
Перейти к основному содержимому

quantileTDigest

Вычисляет приблизительный квантиль числовой последовательности данных, используя алгоритм t-digest.

Потребление памяти составляет log(n), где n — это количество значений. Результат зависит от порядка выполнения запроса и является недетерминированным.

Производительность функции ниже, чем у quantile или quantileTiming. В терминах соотношения между размером состояния и точностью эта функция гораздо лучше, чем quantile.

При использовании нескольких функций quantile* с различными уровнями в одном запросе внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае рекомендуется использовать функцию quantiles.

Синтаксис

quantileTDigest(level)(expr)

Псевдоним: medianTDigest.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение над значениями колонки, в результате которого получаются числовые типы данных, Date или DateTime.

Возвращаемое значение

  • Приблизительный квантиль указанного уровня.

Тип:

  • Float64 для входного числового типа данных.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

SELECT quantileTDigest(number) FROM numbers(10)

Результат:

┌─quantileTDigest(number)─┐
│                     4.5 │
└─────────────────────────┘

Смотрите также