Перейти к основному содержимому
Перейти к основному содержимому

quantileExact функции

quantileExact

Точно вычисляет квантиль числовой последовательности данных.

Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — это количество переданных значений. Однако для небольшого количества значений функция очень эффективна.

При использовании нескольких quantile* функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

quantileExact(level)(expr)

Псевдоним: medianExact.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Мы рекомендуем использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Для числовых типов данных выходной формат будет таким же, как и формат входных данных. Например:

SELECT
    toTypeName(quantileExact(number)) AS `quantile`,
    toTypeName(quantileExact(number::Int32)) AS `quantile_int32`,
    toTypeName(quantileExact(number::Float32)) AS `quantile_float32`,
    toTypeName(quantileExact(number::Float64)) AS `quantile_float64`,
    toTypeName(quantileExact(number::Int64)) AS `quantile_int64`
FROM numbers(1)
   ┌─quantile─┬─quantile_int32─┬─quantile_float32─┬─quantile_float64─┬─quantile_int64─┐
1. │ UInt64   │ Int32          │ Float32          │ Float64          │ Int64          │
   └──────────┴────────────────┴──────────────────┴──────────────────┴────────────────┘

1 row in set. Elapsed: 0.002 sec.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

SELECT quantileExact(number) FROM numbers(10)

Результат:

┌─quantileExact(number)─┐
│                     5 │
└───────────────────────┘

quantileExactLow

Похожая на quantileExact, эта функция вычисляет точный квантиль числовой последовательности данных.

Чтобы получить точное значение, все переданные значения объединяются в массив, который затем полностью сортируется. Сложность алгоритма сортировки составляет O(N·log(N)), где N = std::distance(first, last) — количество сравнений.

Возвращаемое значение зависит от уровня квантиля и количества элементов в выборке, т.е. если уровень равен 0.5, то функция возвращает нижнее медианное значение для четного количества элементов и среднее медианное значение для нечетного количества элементов. Медиана вычисляется аналогично реализации median_low, которая используется в python.

Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array. Например:

SELECT quantileExactLow(0.1)(number) FROM numbers(10)

┌─quantileExactLow(0.1)(number)─┐
│                             1 │
└───────────────────────────────┘

При использовании нескольких quantile* функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

quantileExactLow(level)(expr)

Псевдоним: medianExactLow.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Мы рекомендуем использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Float64 для входных данных числового типа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

SELECT quantileExactLow(number) FROM numbers(10)

Результат:

┌─quantileExactLow(number)─┐
│                        4 │
└──────────────────────────┘

quantileExactHigh

Похожая на quantileExact, эта функция вычисляет точный квантиль числовой последовательности данных.

Все переданные значения объединяются в массив, который затем полностью сортируется, чтобы получить точное значение. Сложность алгоритма сортировки составляет O(N·log(N)), где N = std::distance(first, last) — количество сравнений.

Возвращаемое значение зависит от уровня квантиля и количества элементов в выборке, т.е. если уровень равен 0.5, то функция возвращает верхнее медианное значение для четного количества элементов и среднее медианное значение для нечетного количества элементов. Медиана вычисляется аналогично реализации median_high, которая используется в python. Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array.

Эта реализация ведет себя точно так же, как и текущая реализация quantileExact.

При использовании нескольких quantile* функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

quantileExactHigh(level)(expr)

Псевдоним: medianExactHigh.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Мы рекомендуем использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение для значений колонок, приводящее к числовым типам данных, Date или DateTime.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Float64 для входных данных числового типа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

SELECT quantileExactHigh(number) FROM numbers(10)

Результат:

┌─quantileExactHigh(number)─┐
│                         5 │
└───────────────────────────┘

quantileExactExclusive

Точно вычисляет квантиль числовой последовательности данных.

Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — это количество переданных значений. Однако для небольшого количества значений функция очень эффективна.

Эта функция эквивалентна функции Excel PERCENTILE.EXC (тип R6).

При использовании нескольких quantileExactExclusive функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactExclusive.

Синтаксис

quantileExactExclusive(level)(expr)

Аргументы

Параметры

  • level — Уровень квантиля. Необязательный. Возможные значения: (0, 1) — границы не включены. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану. Float.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Float64 для входных данных числового типа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

CREATE TABLE num AS numbers(1000);

SELECT quantileExactExclusive(0.6)(x) FROM (SELECT number AS x FROM num);

Результат:

┌─quantileExactExclusive(0.6)(x)─┐
│                          599.6 │
└────────────────────────────────┘

quantileExactInclusive

Точно вычисляет квантиль числовой последовательности данных.

Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — это количество переданных значений. Однако для небольшого количества значений функция очень эффективна.

Эта функция эквивалентна функции Excel PERCENTILE.INC (тип R7).

При использовании нескольких quantileExactInclusive функций с разными уровнями в запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactInclusive.

Синтаксис

quantileExactInclusive(level)(expr)

Аргументы

Параметры

  • level — Уровень квантиля. Необязательный. Возможные значения: [0, 1] — границы включены. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану. Float.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Float64 для входных данных числового типа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

CREATE TABLE num AS numbers(1000);

SELECT quantileExactInclusive(0.6)(x) FROM (SELECT number AS x FROM num);

Результат:

┌─quantileExactInclusive(0.6)(x)─┐
│                          599.4 │
└────────────────────────────────┘

Смотрите также