CREATE TABLE

Создает новую таблицу. Этот запрос может иметь различные синтаксические формы в зависимости от случая использования.

По умолчанию таблицы создаются только на текущем сервере. Запросы распределенного DDL реализуются как клаузула ON CLUSTER, которая описана отдельно.

Синтаксические формы

С явной схемой

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [NULL|NOT NULL] [DEFAULT|MATERIALIZED|EPHEMERAL|ALIAS expr1] [COMMENT 'comment for column'] [compression_codec] [TTL expr1],
    name2 [type2] [NULL|NOT NULL] [DEFAULT|MATERIALIZED|EPHEMERAL|ALIAS expr2] [COMMENT 'comment for column'] [compression_codec] [TTL expr2],
    ...
) ENGINE = engine
  [COMMENT 'comment for table']

Создает таблицу с именем table_name в базе данных db или в текущей базе данных, если db не установлен, с структурой, указанной в скобках, и движком engine. Структура таблицы представляет собой список описаний колонок, вторичных индексов и ограничений. Если первичный ключ поддерживается движком, он будет указан как параметр для движка таблицы.

Описание колонки — это name type в самом простом случае. Пример: RegionID UInt32.

Также могут быть определены выражения для значений по умолчанию (см. ниже).

При необходимости можно указать первичный ключ с одним или несколькими выражениями ключа.

Комментарии могут быть добавлены для колонок и для таблицы.

Со схемой, похожей на другую таблицу

CREATE TABLE [IF NOT EXISTS] [db.]table_name AS [db2.]name2 [ENGINE = engine]

Со схемой и данными, скопированными из другой таблицы

CREATE TABLE [IF NOT EXISTS] [db.]table_name CLONE AS [db2.]name2 [ENGINE = engine]

Создает таблицу с такой же структурой, как у другой таблицы. Вы можете указать другой движок для таблицы. Если движок не указан, будет использован такой же движок, как для таблицы db2.name2. После создания новой таблицы все партиции из db2.name2 будут прикреплены к ней. Другими словами, данные из db2.name2 будут скопированы в db.table_name при создании. Этот запрос эквивалентен следующему:

CREATE TABLE [IF NOT EXISTS] [db.]table_name AS [db2.]name2 [ENGINE = engine];
ALTER TABLE [db.]table_name ATTACH PARTITION ALL FROM [db2].name2;

Из табличной функции

CREATE TABLE [IF NOT EXISTS] [db.]table_name AS table_function()

Создает таблицу с таким же результатом, как у указанной табличной функции. Созданная таблица также будет работать так же, как соответствующая таблица, функция которой была указана.

Из запроса SELECT

CREATE TABLE [IF NOT EXISTS] [db.]table_name[(name1 [type1], name2 [type2], ...)] ENGINE = engine AS SELECT ...

Создает таблицу со структурой, аналогичной результату запроса SELECT, с движком engine, и заполняет ее данными из SELECT. Также можно явно указать описание колонок.

Если таблица уже существует и указано IF NOT EXISTS, запрос ничего не сделает.

После клаузулы ENGINE в запросе могут быть другие клаузулы. См. подробную документацию о том, как создавать таблицы в описаниях движков таблиц.

подсказка

В ClickHouse Cloud, пожалуйста, разбейте это на два шага:

Создайте структуру таблицы

CREATE TABLE t1
ENGINE = MergeTree
ORDER BY ...
-- highlight-next-line
EMPTY AS
SELECT ...

Заполните таблицу

INSERT INTO t1
SELECT ...

Пример

Запрос:

CREATE TABLE t1 (x String) ENGINE = Memory AS SELECT 1;
SELECT x, toTypeName(x) FROM t1;

Результат:

┌─x─┬─toTypeName(x)─┐
│ 1 │ String        │
└───┴───────────────┘

Модификаторы NULL или NOT NULL

Модификаторы NULL и NOT NULL после типа данных в определении колонок позволяют или не позволяют его использовать как Nullable.

Если тип не Nullable и указан NULL, он будет рассматриваться как Nullable; если указан NOT NULL, то нет. Например, INT NULL эквивалентен Nullable(INT). Если тип Nullable, и указаны модификаторы NULL или NOT NULL, будет выброшено исключение.

См. также настройку data_type_default_nullable.

Значения по умолчанию

Описание колонки может указывать выражение значения по умолчанию в форме DEFAULT expr, MATERIALIZED expr или ALIAS expr. Пример: URLDomain String DEFAULT domain(URL).

Выражение expr является необязательным. Если оно опущено, тип колонки должен быть явно указан, и значение по умолчанию будет 0 для числовых колонок, '' (пустая строка) для строковых колонок, [] (пустой массив) для массивов, 1970-01-01 для колонок даты или NULL для nullable колонок.

Тип колонки для колонки значения по умолчанию можно опустить, в этом случае он выводится из типа expr. Например, тип колонки EventDate DEFAULT toDate(EventTime) будет датой.

Если указаны как тип данных, так и выражение значения по умолчанию, будет вставлена неявная функция приведения типа, которая преобразует выражение в указанный тип. Пример: Hits UInt32 DEFAULT 0 внутренне представляется как Hits UInt32 DEFAULT toUInt32(0).

Выражение значения по умолчанию expr может ссылаться на произвольные колонки таблицы и константы. ClickHouse проверяет, что изменения структуры таблицы не вводят циклы в расчет выражения. Для INSERT он проверяет, что выражения разрешимы — что все колонки, от которых они могут быть рассчитаны, были переданы.

DEFAULT

DEFAULT expr

Обычное значение по умолчанию. Если значение такой колонки не указано в запросе INSERT, оно вычисляется из expr.

Пример:

CREATE OR REPLACE TABLE test
(
    id UInt64,
    updated_at DateTime DEFAULT now(),
    updated_at_date Date DEFAULT toDate(updated_at)
)
ENGINE = MergeTree
ORDER BY id;

INSERT INTO test (id) VALUES (1);

SELECT * FROM test;
┌─id─┬──────────updated_at─┬─updated_at_date─┐
│  1 │ 2023-02-24 17:06:46 │      2023-02-24 │
└────┴─────────────────────┴─────────────────┘

MATERIALIZED

MATERIALIZED expr

Материализованное выражение. Значения таких колонок автоматически вычисляются в соответствии с указанным материализованным выражением при вставке строк. Значения не могут быть явно указаны во время INSERT.

Кроме того, колонки значений по умолчанию этого типа не включаются в результат SELECT *. Это сделано для сохранения инварианта, что результат SELECT * всегда может быть вставлен обратно в таблицу с помощью INSERT. Это поведение можно отключить с помощью настройки asterisk_include_materialized_columns.

Пример:

CREATE OR REPLACE TABLE test
(
    id UInt64,
    updated_at DateTime MATERIALIZED now(),
    updated_at_date Date MATERIALIZED toDate(updated_at)
)
ENGINE = MergeTree
ORDER BY id;

INSERT INTO test VALUES (1);

SELECT * FROM test;
┌─id─┐
│  1 │
└────┘

SELECT id, updated_at, updated_at_date FROM test;
┌─id─┬──────────updated_at─┬─updated_at_date─┐
│  1 │ 2023-02-24 17:08:08 │      2023-02-24 │
└────┴─────────────────────┴─────────────────┘

SELECT * FROM test SETTINGS asterisk_include_materialized_columns=1;
┌─id─┬──────────updated_at─┬─updated_at_date─┐
│  1 │ 2023-02-24 17:08:08 │      2023-02-24 │
└────┴─────────────────────┴─────────────────┘

EPHEMERAL

EPHEMERAL [expr]

Эфемерная колонка. Колонки этого типа не хранятся в таблице, и нельзя выполнять SELECT по ним. Единственное назначение эфемерных колонок — создавать выражения значений по умолчанию для других колонок.

Вставка без явно указанных колонок пропустит колонки этого типа. Это сделано для сохранения инварианта, что результат SELECT * всегда может быть вставлен обратно в таблицу с помощью INSERT.

Пример:

CREATE OR REPLACE TABLE test
(
    id UInt64,
    unhexed String EPHEMERAL,
    hexed FixedString(4) DEFAULT unhex(unhexed)
)
ENGINE = MergeTree
ORDER BY id;

INSERT INTO test (id, unhexed) VALUES (1, '5a90b714');

SELECT
    id,
    hexed,
    hex(hexed)
FROM test
FORMAT Vertical;

Row 1:
──────
id:         1
hexed:      Z��
hex(hexed): 5A90B714

ALIAS

ALIAS expr

Вычисляемые колонки (синоним). Колонка этого типа не хранится в таблице, и нельзя вставлять значения в нее.

Когда запросы SELECT явно ссылаются на колонки этого типа, значение вычисляется во время выполнения запроса из expr. По умолчанию SELECT * исключает колонки ALIAS. Это поведение можно отключить с помощью настройки asterisk_include_alias_columns.

При использовании запроса ALTER для добавления новых колонок данные для этих колонок не записываются. Вместо этого, при чтении старых данных, у которых нет значений для новых колонок, выражения вычисляются на лету по умолчанию. Однако, если выполнение выражений требует других колонок, которые не указаны в запросе, эти колонки будут дополнительно прочитаны, но только для блоков данных, которым это необходимо.

Если вы добавите новую колонку в таблицу, но позднее измените ее выражение по умолчанию, значения, используемые для старых данных, изменятся (для данных, где значения не хранились на диске). Обратите внимание, что при запуске фоновых слияний данные для колонок, отсутствующих в одной из сливающихся частей, записываются в слитую часть.

Невозможно задать значения по умолчанию для элементов в вложенных структурах данных.

CREATE OR REPLACE TABLE test
(
    id UInt64,
    size_bytes Int64,
    size String ALIAS formatReadableSize(size_bytes)
)
ENGINE = MergeTree
ORDER BY id;

INSERT INTO test VALUES (1, 4678899);

SELECT id, size_bytes, size FROM test;
┌─id─┬─size_bytes─┬─size─────┐
│  1 │    4678899 │ 4.46 MiB │
└────┴────────────┴──────────┘

SELECT * FROM test SETTINGS asterisk_include_alias_columns=1;
┌─id─┬─size_bytes─┬─size─────┐
│  1 │    4678899 │ 4.46 MiB │
└────┴────────────┴──────────┘

Первичный ключ

Вы можете определить первичный ключ при создании таблицы. Первичный ключ можно указать двумя способами:

Внутри списка колонок

CREATE TABLE db.table_name
(
    name1 type1, name2 type2, ...,
    PRIMARY KEY(expr1[, expr2,...])
)
ENGINE = engine;

Снаружи списка колонок

CREATE TABLE db.table_name
(
    name1 type1, name2 type2, ...
)
ENGINE = engine
PRIMARY KEY(expr1[, expr2,...]);

подсказка

Вы не можете комбинировать оба способа в одном запросе.

Ограничения

Помимо описаний колонок можно определить ограничения:

CONSTRAINT

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [compression_codec] [TTL expr1],
    ...
    CONSTRAINT constraint_name_1 CHECK boolean_expr_1,
    ...
) ENGINE = engine

boolean_expr_1 может быть любой логической выражением. Если для таблицы определены ограничения, каждое из них будет проверено для каждой строки в запросе INSERT. Если любое ограничение не выполнено — сервер выдаст исключение с именем ограничения и выражением проверки.

Добавление большого количества ограничений может отрицательно сказаться на производительности больших запросов INSERT.

ASSUME

Клаузула ASSUME используется для определения CONSTRAINT на таблице, который предполагается верным. Это ограничение затем может быть использовано оптимизатором для повышения производительности SQL-запросов.

Возьмите этот пример, где ASSUME CONSTRAINT используется при создании таблицы users_a:

CREATE TABLE users_a (
    uid Int16, 
    name String, 
    age Int16, 
    name_len UInt8 MATERIALIZED length(name), 
    CONSTRAINT c1 ASSUME length(name) = name_len
) 
ENGINE=MergeTree 
ORDER BY (name_len, name);

Здесь ASSUME CONSTRAINT используется для утверждения, что функция length(name) всегда равна значению колонки name_len. Это означает, что каждый раз, когда length(name) вызывается в запросе, ClickHouse может заменить его на name_len, что должно быть быстрее, поскольку избегает вызова функции length().

Затем, при выполнении запроса SELECT name FROM users_a WHERE length(name) < 5;, ClickHouse может оптимизировать его в SELECT name FROM users_a WHERE name_len < 5; благодаря ASSUME CONSTRAINT. Это может ускорить выполнение запроса, поскольку избегает вычисления длины name для каждой строки.

ASSUME CONSTRAINT не налагает ограничение, он всего лишь сообщает оптимизатору, что ограничение действительно. Если ограничение на самом деле не верно, результаты запросов могут быть некорректными. Поэтому следует использовать ASSUME CONSTRAINT, только если вы уверены, что ограничение верно.

TTL выражение

Определяет время хранения значений. Может быть указано только для таблиц семейства MergeTree. Для подробного описания см. TTL для колонок и таблиц.

Кодеки сжатия колонок

По умолчанию ClickHouse применяет сжатие lz4 в самоуправляемой версии и zstd в ClickHouse Cloud.

Для семьи движков MergeTree вы можете изменить метод сжатия по умолчанию в разделе compression конфигурации сервера.

Вы также можете определить метод сжатия для каждой отдельной колонки в запросе CREATE TABLE.

CREATE TABLE codec_example
(
    dt Date CODEC(ZSTD),
    ts DateTime CODEC(LZ4HC),
    float_value Float32 CODEC(NONE),
    double_value Float64 CODEC(LZ4HC(9)),
    value Float32 CODEC(Delta, ZSTD)
)
ENGINE = <Engine>
...

Кодек Default может быть указан для ссылки на стандартное сжатие, которое может зависеть от различных настроек (и свойств данных) во время выполнения. Пример: value UInt64 CODEC(Default) — то же самое, что отсутствие указания кодека.

Также вы можете удалить текущий CODEC из колонки и использовать стандартное сжатие из config.xml:

ALTER TABLE codec_example MODIFY COLUMN float_value CODEC(Default);

Кодеки могут комбинироваться в пайплайне, например, CODEC(Delta, Default).

подсказка

Вы не можете распаковывать файлы базы данных ClickHouse с помощью внешних утилит, таких как lz4. Вместо этого используйте специальную утилиту clickhouse-compressor.

Сжатие поддерживается для следующих движков таблиц:

MergeTree семьи. Поддерживает кодеки сжатия колонок и выбор метода сжатия по умолчанию с помощью настройки compression.
Log семьи. Использует метод сжатия lz4 по умолчанию и поддерживает кодеки сжатия колонок.
Set. Поддерживается только стандартное сжатие.
Join. Поддерживается только стандартное сжатие.

ClickHouse поддерживает кодеки общего назначения и специализированные кодеки.

Кодеки общего назначения

NONE

NONE — Без сжатия.

LZ4

LZ4 — Безубыточный алгоритм сжатия данных, используемый по умолчанию. Применяет быстрое сжатие LZ4.

LZ4HC

LZ4HC[(level)] — Алгоритм LZ4 HC (высокое сжатие) с настраиваемым уровнем. Уровень по умолчанию: 9. Установка level <= 0 применяет уровень по умолчанию. Возможные уровни: [1, 12]. Рекомендуемый диапазон уровней: [4, 9].

ZSTD

ZSTD[(level)] — Алгоритм сжатия ZSTD с настраиваемым level. Возможные уровни: [1, 22]. Уровень по умолчанию: 1.

Высокие уровни сжатия полезны для асимметричных сценариев, например, сжимать один раз, разжимать многократно. Более высокие уровни означают лучшее сжатие и более высокое использование CPU.

ZSTD_QAT

Not supported in ClickHouse Cloud

ZSTD_QAT[(level)] — Алгоритм сжатия ZSTD с настраиваемым уровнем, реализованный с помощью Intel® QATlib и Intel® QAT ZSTD Plugin. Возможные уровни: [1, 12]. Уровень по умолчанию: 1. Рекомендуемый диапазон уровней: [6, 12]. Применяются некоторые ограничения:

ZSTD_QAT по умолчанию отключен и может быть использован только после включения настройки конфигурации enable_zstd_qat_codec.
Для сжатия ZSTD_QAT пытается использовать устройство разгрузки Intel® QAT (QuickAssist Technology). Если такое устройство не найдено, оно вернется к сжатию ZSTD в программном обеспечении.
Распаковка всегда выполняется в программном обеспечении.

DEFLATE_QPL

Not supported in ClickHouse Cloud

DEFLATE_QPL — Алгоритм сжатия Deflate, реализованный библиотекой Intel® Query Processing Library. Применяются некоторые ограничения:

DEFLATE_QPL по умолчанию отключен и может быть использован только после включения настройки конфигурации enable_deflate_qpl_codec.
DEFLATE_QPL требует сборку ClickHouse, скомпилированную с инструкциями SSE 4.2 (по умолчанию это так). Смотрите Сборка Clickhouse с DEFLATE_QPL для получения дополнительных сведений.
DEFLATE_QPL работает лучше, если в системе имеется устройство разгрузки Intel® IAA (Accelerator). Смотрите Конфигурация ускорителя и Тестирование с DEFLATE_QPL для получения дополнительных сведений.
Данные, сожатые с использованием DEFLATE_QPL, могут передаваться только между узлами ClickHouse, скомпилированными с включенными SSE 4.2.

Специализированные кодеки

Эти кодеки разработаны, чтобы сделать сжатие более эффективным, используя конкретные особенности данных. Некоторые из этих кодеков не сжимают данные сами по себе, вместо этого они предварительно обрабатывают данные так, чтобы второй этап сжатия с использованием кодека общего назначения мог достичь более высокой степени сжатия данных.

Delta

Delta(delta_bytes) — Подход к сжатию, при котором сырые значения заменяются разностью двух соседних значений, за исключением первого значения, которое остается неизменным. delta_bytes — максимальный размер сырых значений, значение по умолчанию — sizeof(type). Указание delta_bytes как аргумента устарело, и поддержка будет удалена в будущих версиях. Delta является кодеком подготовки данных, т.е. он не может быть использован отдельно.

DoubleDelta

DoubleDelta(bytes_size) — Вычисляет дельту дельт и записывает ее в компактной двоичной форме. bytes_size имеет аналогичное значение, как delta_bytes в кодеке Delta. Указание bytes_size как аргумента устарело, и поддержка будет удалена в будущих версиях. Оптимальные коэффициенты сжатия достигаются для монотонных последовательностей с постоянным шагом, таких как данные временных рядов. Может быть использован с любым числовым типом. Реализует алгоритм, используемый в Gorilla TSDB, расширяя его для поддержки 64-битных типов. Использует 1 дополнительный бит для 32-битных дельт: 5-битные префиксы вместо 4-битных префиксов. Для получения дополнительной информации см. Сжатие временных меток в Gorilla: Быстрая, масштабируемая база данных временных рядов в памяти. DoubleDelta является кодеком подготовки данных, т.е. он не может быть использован отдельно.

GCD

GCD() — Вычисляет наибольший общий делитель (НОД) значений в колонке, затем делит каждое значение на НОД. Может использоваться с целочисленными, десятичными и дата/время колонками. Кодек хорошо подходит для колонок со значениями, которые изменяются (увеличиваются или уменьшаются) кратно НОД, например, 24, 28, 16, 24, 8, 24 (НОД = 4). GCD является кодеком подготовки данных, т.е. он не может быть использован отдельно.

Gorilla

Gorilla(bytes_size) — Вычисляет XOR между текущим и предыдущим значением с плавающей запятой и записывает его в компактной двоичной форме. Чем меньше разница между последовательными значениями, то есть, чем медленнее значения серии изменяются, тем лучше коэффициент сжатия. Реализует алгоритм, используемый в Gorilla TSDB, расширяя его для поддержки 64-битных типов. Возможные значения bytes_size: 1, 2, 4, 8, значение по умолчанию — sizeof(type), если равно 1, 2, 4 или 8. В остальных случаях — 1. Для получения дополнительной информации см. раздел 4.1 в Gorilla: Быстрая, масштабируемая база данных временных рядов в памяти.

FPC

FPC(level, float_size) — Последовательно предсказывает следующее значение с плавающей запятой в последовательности, используя лучший из двух предсказателей, затем XOR-ирует фактическое и предсказанное значение и сжимает результат, заполнив ведущими нулями. Подобно Gorilla, это эффективно при хранении серии значений с плавающей запятой, которые изменяются медленно. Для 64-битных значений (double) FPC быстрее, чем Gorilla, для 32-битных значений результаты могут варьироваться. Возможные значения level: 1-28, значение по умолчанию — 12. Возможные значения float_size: 4, 8, значение по умолчанию — sizeof(type), если тип — Float. В остальных случаях — 4. Для подробного описания алгоритма см. Высокопроизводительное сжатие данных с плавающей запятой двойной точности.

T64

T64 — Подход к сжатию, который обрезает неиспользуемые высокие биты значений в целочисленных типах данных (включая Enum, Date и DateTime). На каждом этапе своего алгоритма кодек берет блок из 64 значений, помещает их в матрицу 64x64 бита, транспонирует ее, обрезает неиспользуемые биты значений и возвращает оставшиеся в виде последовательности. Неиспользуемые биты — это биты, которые не различаются между максимальными и минимальными значениями во всей части данных, для которой используется сжатие.

Кодеки DoubleDelta и Gorilla используются в Gorilla TSDB как компоненты его алгоритма сжатия. Подход Gorilla эффективен в сценариях, когда имеется последовательность медленно изменяющихся значений с их временными метками. Временные метки эффективно сжимаются кодеком DoubleDelta, а значения эффективно сжимаются кодеком Gorilla. Например, для получения эффективно хранимой таблицы вы можете создать ее в следующей конфигурации:

CREATE TABLE codec_example
(
    timestamp DateTime CODEC(DoubleDelta),
    slow_values Float32 CODEC(Gorilla)
)
ENGINE = MergeTree()

Кодеки шифрования

Эти кодеки не сжимают данные, а шифруют данные на диске. Они доступны только при указании ключа шифрования в настройках encryption. Обратите внимание, что шифрование имеет смысл только в конце цепочек кодеков, потому что зашифрованные данные обычно не могут быть сжаты каким-либо смысловым образом.

Кодеки шифрования:

AES_128_GCM_SIV

CODEC('AES-128-GCM-SIV') — Шифрует данные с помощью AES-128 в режиме RFC 8452 GCM-SIV.

AES-256-GCM-SIV

CODEC('AES-256-GCM-SIV') — Шифрует данные с помощью AES-256 в режиме GCM-SIV.

Эти кодеки используют фиксированное значение nonce, и поэтому шифрование является детерминированным. Это делает его совместимым с движками дедупликации, такими как ReplicatedMergeTree, но имеет слабость: когда один и тот же блок данных шифруется дважды, полученный шифротекст будет точно таким же, поэтому злоумышленник, который может считывать диск, может видеть это равенство (хотя только равенство, не получая его содержимого).

примечание

Большинство движков, включая семью "*MergeTree", создают индексы на диске без применения кодеков. Это означает, что открытые данные будут видны на диске, если зашифрованная колонка индексируется.

примечание

Если вы выполняете запрос SELECT, упоминающий конкретное значение в зашифрованной колонке (например, в операторе WHERE), значение может появиться в system.query_log. Возможно, вы захотите отключить ведение журнала.

Пример

CREATE TABLE mytable
(
    x String CODEC(AES_128_GCM_SIV)
)
ENGINE = MergeTree ORDER BY x;

примечание

Если необходимо применить сжатие, это должно быть явно указано. В противном случае, только шифрование будет применено к данным.

Пример

CREATE TABLE mytable
(
    x String CODEC(Delta, LZ4, AES_128_GCM_SIV)
)
ENGINE = MergeTree ORDER BY x;

Временные таблицы

примечание

Обратите внимание, что временные таблицы не реплицируются. В результате нет гарантии, что данные, вставленные во временную таблицу, будут доступны в других репликах. Основное применение временных таблиц может быть полезным для выполнения запросов или соединения небольших внешних наборов данных в течение одной сессии.

ClickHouse поддерживает временные таблицы, которые имеют следующие характеристики:

Временные таблицы исчезают, когда сессия заканчивается, включая случаи, когда соединение теряется.
Временная таблица использует движок Memory, когда движок не указан, и может использовать любой движок, кроме реплицированных и KeeperMap движков.
База данных не может быть указана для временной таблицы. Она создается вне баз данных.
Невозможно создать временную таблицу с запросом распределенного DDL на всех серверах кластера (используя ON CLUSTER): эта таблица существует только в текущей сессии.
Если временная таблица имеет такое же имя, как другая, и запрос указывает имя таблицы без указания базы данных, будет использоваться временная таблица.
Для распределенной обработки запросов временные таблицы с использованием движка Memory, использованные в запросе, передаются на удаленные серверы.

Для создания временной таблицы используйте следующий синтаксис:

CREATE TEMPORARY TABLE [IF NOT EXISTS] table_name
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) [ENGINE = engine]

В большинстве случаев временные таблицы не создаются вручную, а используются при работе с внешними данными для запроса или для распределенного (GLOBAL) IN. Для получения дополнительной информации см. соответствующие разделы.

Также возможно использовать таблицы с ENGINE = Memory вместо временных таблиц.

REPLACE TABLE

Инструкция REPLACE позволяет вам обновлять таблицу атомарно.

примечание

Эта инструкция поддерживается для движков баз данных Atomic и Replicated, которые являются движками баз данных по умолчанию для ClickHouse и ClickHouse Cloud соответственно.

Обычно, если вам нужно удалить некоторые данные из таблицы, вы можете создать новую таблицу и заполнить ее запросом SELECT, который не получает нежелательные данные, затем удалить старую таблицу и переименовать новую. Этот подход демонстрируется в примере ниже:

CREATE TABLE myNewTable AS myOldTable;

INSERT INTO myNewTable
SELECT * FROM myOldTable 
WHERE CounterID <12345;

DROP TABLE myOldTable;

RENAME TABLE myNewTable TO myOldTable;

Вместо указанного подхода также возможно использовать REPLACE (при условии, что вы используете стандартные движки баз данных) для достижения того же результата:

REPLACE TABLE myOldTable
ENGINE = MergeTree()
ORDER BY CounterID 
AS
SELECT * FROM myOldTable
WHERE CounterID <12345;

Синтаксис

{CREATE [OR REPLACE] | REPLACE} TABLE [db.]table_name

примечание

Все синтаксические формы для оператора CREATE также работают для этого оператора. Вызов REPLACE для несуществующей таблицы приведет к ошибке.

Примеры:

Local
Cloud

Рассмотрим следующую таблицу:

CREATE DATABASE base 
ENGINE = Atomic;

CREATE OR REPLACE TABLE base.t1
(
    n UInt64,
    s String
)
ENGINE = MergeTree
ORDER BY n;

INSERT INTO base.t1 VALUES (1, 'test');

SELECT * FROM base.t1;

┌─n─┬─s────┐
│ 1 │ test │
└───┴──────┘

Мы можем использовать инструкцию REPLACE, чтобы очистить все данные:

CREATE OR REPLACE TABLE base.t1 
(
    n UInt64,
    s Nullable(String)
)
ENGINE = MergeTree
ORDER BY n;

INSERT INTO base.t1 VALUES (2, null);

SELECT * FROM base.t1;

┌─n─┬─s──┐
│ 2 │ \N │
└───┴────┘

Или мы можем использовать инструкцию REPLACE, чтобы изменить структуру таблицы:

REPLACE TABLE base.t1 (n UInt64) 
ENGINE = MergeTree 
ORDER BY n;

INSERT INTO base.t1 VALUES (3);

SELECT * FROM base.t1;

┌─n─┐
│ 3 │
└───┘

Рассмотрим следующую таблицу в ClickHouse Cloud:

CREATE DATABASE base;

CREATE OR REPLACE TABLE base.t1 
(
    n UInt64,
    s String
)
ENGINE = MergeTree
ORDER BY n;

INSERT INTO base.t1 VALUES (1, 'test');

SELECT * FROM base.t1;

1    test

Мы можем использовать инструкцию REPLACE, чтобы очистить все данные:

CREATE OR REPLACE TABLE base.t1 
(
    n UInt64, 
    s Nullable(String)
)
ENGINE = MergeTree
ORDER BY n;

INSERT INTO base.t1 VALUES (2, null);

SELECT * FROM base.t1;

2

Или мы можем использовать инструкцию REPLACE, чтобы изменить структуру таблицы:

REPLACE TABLE base.t1 (n UInt64) 
ENGINE = MergeTree 
ORDER BY n;

INSERT INTO base.t1 VALUES (3);

SELECT * FROM base.t1;

3

Клаузула COMMENT

Вы можете добавить комментарий к таблице при ее создании.

Синтаксис

CREATE TABLE db.table_name
(
    name1 type1, name2 type2, ...
)
ENGINE = engine
COMMENT 'Comment'

Пример

Запрос:

CREATE TABLE t1 (x String) ENGINE = Memory COMMENT 'The temporary table';
SELECT name, comment FROM system.tables WHERE name = 't1';

Результат:

┌─name─┬─comment─────────────┐
│ t1   │ The temporary table │
└──────┴─────────────────────┘

Синтаксические формы​

С явной схемой​

Со схемой, похожей на другую таблицу​

Со схемой и данными, скопированными из другой таблицы​

Из табличной функции​

Из запроса SELECT​

Модификаторы NULL или NOT NULL​

Значения по умолчанию​

DEFAULT​

MATERIALIZED​

EPHEMERAL​

ALIAS​

Первичный ключ​

Ограничения​

CONSTRAINT​

ASSUME​

TTL выражение​

Кодеки сжатия колонок​

Кодеки общего назначения​

NONE​

LZ4​

LZ4HC​

ZSTD​

ZSTD_QAT​

DEFLATE_QPL​

Специализированные кодеки​

Delta​

DoubleDelta​

GCD​

Gorilla​

FPC​

T64​

Кодеки шифрования​

AES_128_GCM_SIV​

AES-256-GCM-SIV​

Временные таблицы​

REPLACE TABLE​

Синтаксис​

Примеры:​

Клаузула COMMENT​

Связанный контент​

Синтаксические формы

С явной схемой

Со схемой, похожей на другую таблицу

Со схемой и данными, скопированными из другой таблицы

Из табличной функции

Из запроса SELECT

Модификаторы NULL или NOT NULL

Значения по умолчанию

DEFAULT

MATERIALIZED

EPHEMERAL

ALIAS

Первичный ключ

Ограничения

CONSTRAINT

ASSUME

TTL выражение

Кодеки сжатия колонок

Кодеки общего назначения

NONE

LZ4

LZ4HC

ZSTD

ZSTD_QAT

DEFLATE_QPL

Специализированные кодеки

Delta

DoubleDelta

GCD

Gorilla

FPC

T64

Кодеки шифрования

AES_128_GCM_SIV

AES-256-GCM-SIV

Временные таблицы

REPLACE TABLE

Синтаксис

Примеры:

Клаузула COMMENT

Связанный контент