Перейти к основному содержимому
Перейти к основному содержимому

Настройки формата

Эти настройки автоматически созданы из source.

allow_special_bool_values_inside_variant

Позволяет парсить булевы значения внутри типа Variant из специальных текстовых булевых значений, таких как "on", "off", "enable", "disable" и т.д.

bool_false_representation

Текст для представления ложного булева значения в форматах TSV/CSV/Vertical/Pretty.

bool_true_representation

Текст для представления истинного булева значения в форматах TSV/CSV/Vertical/Pretty.

column_names_for_schema_inference

Список имен колонок, которые будут использоваться для вывода схемы для форматов без имен колонок. Формат: 'column1,column2,column3,...'

cross_to_inner_join_rewrite

Использовать внутреннее соединение вместо запятой/перекрестного соединения, если в разделе WHERE есть выражения соединения. Значения: 0 - без замены, 1 - применять, если возможно для запятой/перекрестного, 2 - принудительно заменить все запятые, cross - если возможно

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

Динамически обрезать конечные нули значений datetime64 для подгонки масштаба вывода к [0, 3, 6], соответствующие 'секундам', 'миллисекундам' и 'микросекундам'

date_time_input_format

Позволяет выбрать парсер текстового представления даты и времени.

Настройка не применяется к функциям даты и времени.

Возможные значения:

  • 'best_effort' — Включает расширенный парсинг.

    ClickHouse может парсить основной формат YYYY-MM-DD HH:MM:SS и все форматы даты и времени ISO 8601. Например, '2018-06-08T01:02:03.000Z'.

  • 'best_effort_us' — Аналогично best_effort (см. различия в parseDateTimeBestEffortUS

  • 'basic' — Использовать основной парсер.

    ClickHouse может парсить только основной формат YYYY-MM-DD HH:MM:SS или YYYY-MM-DD. Например, 2019-08-20 10:18:56 или 2019-08-20.

Значение по умолчанию в облаке: 'best_effort'.

Смотрите также:

date_time_output_format

Позволяет выбрать разные форматы вывода текстового представления даты и времени.

Возможные значения:

  • simple - Простой формат вывода.

    ClickHouse выводит дату и время в формате YYYY-MM-DD hh:mm:ss. Например, 2019-08-20 10:18:56. Расчет производится в соответствии с временной зоной типа данных (если присутствует) или временной зоной сервера.

  • iso - ISO формат вывода.

    ClickHouse выводит дату и время в формате ISO 8601 YYYY-MM-DDThh:mm:ssZ. Например, 2019-08-20T10:18:56Z. Обратите внимание, что вывод идет в UTC (Z означает UTC).

  • unix_timestamp - Формат вывода Unix timestamp.

    ClickHouse выводит дату и время в формате Unix timestamp. Например, 1566285536.

Смотрите также:

date_time_overflow_behavior

Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в целевом типе.

Возможные значения:

  • ignore — Безмолвно игнорирует переполнения. Результаты неопределены.
  • throw — Генерирует исключение в случае переполнения.
  • saturate — Насыщает результат. Если значение меньше минимального значения, которое можно представить целевым типом, результат выбирается как минимальное представимое значение. Если значение больше максимального значения, которое можно представить целевым типом, результат выбирается как максимальное представимое значение.

Значение по умолчанию: ignore.

dictionary_use_async_executor

Выполнять пайплайн для чтения источника словаря в несколько потоков. Поддерживается только словарями с локальным источником CLICKHOUSE.

errors_output_format

Метод записи ошибок в текстовый вывод.

exact_rows_before_limit

Когда включено, ClickHouse будет предоставлять точное значение для статистики rows_before_limit_at_least, но с тем ценой, что данные перед лимитом придется считать полностью.

format_avro_schema_registry_url

Для формата AvroConfluent: URL реестра схем Confluent.

format_binary_max_array_size

Максимально допустимый размер массива в формате RowBinary. Это предотвращает выделение большого объема памяти в случае поврежденных данных. 0 означает, что ограничений нет.

format_binary_max_string_size

Максимально допустимый размер строки в формате RowBinary. Это предотвращает выделение большого объема памяти в случае поврежденных данных. 0 означает, что ограничений нет.

format_capn_proto_enum_comparising_mode

Как сопоставить ClickHouse Enum и CapnProto Enum.

format_capn_proto_use_autogenerated_schema

Использовать автоматически сгенерированную схему CapnProto, когда format_schema не задан.

format_csv_allow_double_quotes

Если установлено в true, разрешить строки в двойных кавычках.

format_csv_allow_single_quotes

Если установлено в true, разрешить строки в одинарных кавычках.

format_csv_delimiter

Символ, который будет считаться разделителем в данных CSV. Если задана строка, строка должна иметь длину 1.

format_csv_null_representation

Пользовательское представление NULL в формате CSV.

format_custom_escaping_rule

Правило экранирования полей (для формата CustomSeparated).

format_custom_field_delimiter

Разделитель между полями (для формата CustomSeparated).

format_custom_result_after_delimiter

Суффикс после результата (для формата CustomSeparated).

format_custom_result_before_delimiter

Префикс перед результатом (для формата CustomSeparated).

format_custom_row_after_delimiter

Разделитель после поля последней колонки (для формата CustomSeparated).

format_custom_row_before_delimiter

Разделитель перед полем первой колонки (для формата CustomSeparated).

format_custom_row_between_delimiter

Разделитель между строками (для формата CustomSeparated).

format_display_secrets_in_show_and_select

Включает или отключает отображение секретов в запросах SHOW и SELECT для таблиц, баз данных, табличных функций и словарей.

Пользователь, желающий видеть секреты, также должен иметь включенными display_secrets_in_show_and_select серверную настройку и привилегию displaySecretsInShowAndSelect.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

format_json_object_each_row_column_for_object_name

Имя колонки, которое будет использоваться для хранения/записи имен объектов в формате JSONObjectEachRow. Тип колонки должен быть строковым. Если значение пустое, по умолчанию будут использоваться имена row_{i} для имен объектов.

format_protobuf_use_autogenerated_schema

Использовать автоматически сгенерированный Protobuf, когда format_schema не задан.

format_regexp

Регулярное выражение (для формата Regexp).

format_regexp_escaping_rule

Правило экранирования полей (для формата Regexp).

format_regexp_skip_unmatched

Пропустить строки, которые не соответствуют регулярному выражению (для формата Regexp).

format_schema

Этот параметр полезен, когда вы используете форматы, которые требуют определения схемы, такие как Cap'n Proto или Protobuf. Значение зависит от формата.

format_schema_message_name

Определите имя необходимого сообщения в схеме, определенной в format_schema. Чтобы поддерживать совместимость с устаревшим форматом schema_schema (file_name:message_name):

  • Если format_schema_message_name не задано, имя сообщения выводится из части message_name устаревшего значения format_schema.
  • Если format_schema_message_name задано при использовании устаревшего формата, будет вызвана ошибка.

format_schema_source

Определите источник format_schema. Возможные значения:

  • 'file' (по умолчанию):: format_schema - это имя файла схемы, расположенного в каталоге format_schemas.
  • 'string': format_schema является буквальным содержимым схемы.
  • 'query': format_schema является запросом для получения схемы. Когда format_schema_source установлено в 'query', применяются следующие условия:
  • Запрос должен возвращать строго одно значение: одну строку с единственной строковой колонкой.
  • Результат запроса считается содержимым схемы.
  • Этот результат кэшируется локально в каталоге format_schemas.
  • Вы можете очистить локальный кэш, используя команду: SYSTEM DROP FORMAT SCHEMA CACHE FOR Files.
  • После кэширования одинаковые запросы не выполняются для повторного получения схемы до тех пор, пока кэш не будет явно очищен.
  • В дополнение к локальным кэшированным файлам, сообщения Protobuf также кэшируются в памяти. Даже после очистки локальных кэшированных файлов в памяти кэш должен быть очищен с помощью SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf], чтобы полностью обновить схему.
  • Запустите запрос SYSTEM DROP FORMAT SCHEMA CACHE, чтобы очистить кеш как для кэшированных файлов, так и для схем сообщений Protobuf одновременно.

format_template_resultset

Путь к файлу, содержащему строку формата для результирующего набора (для формата Template).

format_template_resultset_format

Строка формата для результирующего набора (для формата Template).

format_template_row

Путь к файлу, содержащему строку формата для строк (для формата Template).

format_template_row_format

Строка формата для строк (для формата Template).

format_template_rows_between_delimiter

Разделитель между строками (для формата Template).

format_tsv_null_representation

Пользовательское представление NULL в формате TSV.

input_format_allow_errors_num

Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.д.).

Значение по умолчанию - 0.

Всегда сочетайте с input_format_allow_errors_ratio.

Если ошибка произошла при чтении строк, но счетчик ошибок все еще меньше input_format_allow_errors_num, ClickHouse игнорирует строку и переходит к следующей.

Если превышены как input_format_allow_errors_num, так и input_format_allow_errors_ratio, ClickHouse выдает исключение.

input_format_allow_errors_ratio

Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.д.). Процент ошибок устанавливается как число с плавающей точкой между 0 и 1.

Значение по умолчанию - 0.

Всегда сочетайте с input_format_allow_errors_num.

Если ошибка произошла при чтении строк, но счетчик ошибок все еще меньше input_format_allow_errors_ratio, ClickHouse игнорирует строку и переходит к следующей.

Если превышены как input_format_allow_errors_num, так и input_format_allow_errors_ratio, ClickHouse выдает исключение.

input_format_allow_seeks

Разрешить поиски при чтении в форматах ввода ORC/Parquet/Arrow.

Включено по умолчанию.

input_format_arrow_allow_missing_columns

Разрешить отсутствующие колонки при чтении в форматах ввода Arrow.

input_format_arrow_case_insensitive_column_matching

Игнорировать регистр при соответствии колонок Arrow и колонок CH.

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

Пропустить колонки с неподдерживаемыми типами при выводе схемы для формата Arrow.

input_format_avro_allow_missing_fields

Для формата Avro/AvroConfluent: когда поле не найдено в схеме, использовать значение по умолчанию вместо ошибки.

input_format_avro_null_as_default

Для формата Avro/AvroConfluent: вставить значение по умолчанию в случае null и не Nullable.

input_format_binary_decode_types_in_binary_format

Читать типы данных в бинарном формате вместо имен типов в формате ввода RowBinaryWithNamesAndTypes.

input_format_binary_read_json_as_string

Читать значения типа JSON как строки JSON String в формате RowBinary.

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

Пропустить поля с неподдерживаемыми типами при выводе схемы для формата BSON.

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

Пропустить колонки с неподдерживаемыми типами при выводе схемы для формата CapnProto.

input_format_csv_allow_cr_end_of_line

Если установлено в true, \r будет разрешено в конце строки без последующей

input_format_csv_allow_variable_number_of_columns

Игнорировать дополнительные колонки в формате ввода CSV (если файл имеет больше колонок, чем ожидалось) и считать отсутствующие поля в формате CSV значениями по умолчанию.

input_format_csv_allow_whitespace_or_tab_as_delimiter

Разрешить использовать пробелы и табуляции (\t) в качестве разделителей полей в строках CSV.

input_format_csv_arrays_as_nested_csv

При чтении массива из CSV ждать, что его элементы были сериализованы в вложенный CSV и затем помещены в строку. Пример: "[""Hello"", ""world"", ""42"""" TV""]". Скобки вокруг массива можно опустить.

input_format_csv_deserialize_separate_columns_into_tuple

Если установлено в true, тогда отдельные колонки, записанные в формате CSV, могут быть десериализованы в кортеж.

input_format_csv_detect_header

Автоматически обнаруживать заголовок с именами и типами в формате CSV.

input_format_csv_empty_as_default

Считать пустые поля в формате CSV значениями по умолчанию.

input_format_csv_enum_as_number

Считать вставленные значения enum в формате CSV как индексы enum.

input_format_csv_skip_first_lines

Пропустить указанное количество строк в начале данных в формате CSV.

input_format_csv_skip_trailing_empty_lines

Пропустить завершающие пустые строки в формате CSV.

input_format_csv_trim_whitespaces

Обрезать пробелы и символы табуляции (\t) в начале и конце строк CSV.

input_format_csv_try_infer_numbers_from_strings

Если включено, при выводе схемы ClickHouse будет пытаться вывести числа из строковых полей. Это может быть полезно, если данные в CSV содержат заключенные в кавычки числа UInt64.

Отключено по умолчанию.

input_format_csv_try_infer_strings_from_quoted_tuples

Интерпретировать заключенные в кавычки кортежи во входных данных как значение типа String.

input_format_csv_use_best_effort_in_schema_inference

Использовать некоторые уловки и эвристики для вывода схемы в формате CSV.

input_format_csv_use_default_on_bad_values

Разрешить установить значение по умолчанию для колонки, когда десериализация поля CSV завершилась неудачей из-за некорректного значения.

input_format_custom_allow_variable_number_of_columns

Игнорировать дополнительные колонки в формате ввода CustomSeparated (если файл имеет больше колонок, чем ожидалось) и считать отсутствующие поля в формате CustomSeparated значениями по умолчанию.

input_format_custom_detect_header

Автоматически обнаруживать заголовок с именами и типами в формате CustomSeparated.

input_format_custom_skip_trailing_empty_lines

Пропустить завершающие пустые строки в формате CustomSeparated.

input_format_defaults_for_omitted_fields

При выполнении запросов INSERT заменять пропущенные значения входных колонок значениями по умолчанию соответствующих колонок. Эта опция применяется к JSONEachRow (и другим JSON форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native и форматам с суффиксами WithNames/WithNamesAndTypes.

примечание

Когда эта опция включена, расширенные метаданные таблицы отправляются с сервера на клиент. Это потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

input_format_force_null_for_omitted_fields

Принудительно инициализировать пропущенные поля значениями null.

input_format_hive_text_allow_variable_number_of_columns

Игнорировать дополнительные колонки в формате Hive Text (если файл имеет больше колонок, чем ожидалось) и считать отсутствующие поля в формате Hive Text значениями по умолчанию.

input_format_hive_text_collection_items_delimiter

Разделитель между элементами коллекции (массива или map) в формате Hive Text File.

input_format_hive_text_fields_delimiter

Разделитель между полями в формате Hive Text File.

input_format_hive_text_map_keys_delimiter

Разделитель между парой ключ/значение в формате Hive Text File.

input_format_import_nested_json

Включает или отключает вставку данных JSON с вложенными объектами.

Поддерживаемые форматы:

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

Смотрите также:

input_format_ipv4_default_on_conversion_error

Десериализация IPv4 будет использовать значения по умолчанию вместо вызова исключения при ошибке конвертации.

Отключено по умолчанию.

input_format_ipv6_default_on_conversion_error

Десериализация IPV6 будет использовать значения по умолчанию вместо вызова исключения при ошибке конвертации.

Отключено по умолчанию.

input_format_json_compact_allow_variable_number_of_columns

Разрешить переменное количество колонок в строках в форматах ввода JSONCompact/JSONCompactEachRow. Игнорировать дополнительные колонки в строках с большим количеством колонок, чем ожидалось, и считать отсутствующие колонки значениями по умолчанию.

Отключено по умолчанию.

input_format_json_defaults_for_missing_elements_in_named_tuple

Вставить значения по умолчанию для отсутствующих элементов в JSON объекте при парсинге именованного кортежа. Эта настройка работает только при включенной настройке input_format_json_named_tuples_as_objects.

Включено по умолчанию.

input_format_json_empty_as_default

При включении заменить пустые входные поля в JSON значениями по умолчанию. Для сложных выражений по умолчанию input_format_defaults_for_omitted_fields также должно быть включено.

Возможные значения:

  • 0 — Отключить.
  • 1 — Включить.

input_format_json_ignore_unknown_keys_in_named_tuple

Игнорировать неизвестные ключи в JSON объекте для именованных кортежей.

Включено по умолчанию.

input_format_json_ignore_unnecessary_fields

Игнорировать ненужные поля и не парсить их. Включение этого может не вызывать исключения для строк JSON неверного формата или с дублированными полями.

input_format_json_infer_array_of_dynamic_from_array_of_different_types

Если включено, при выводе схемы ClickHouse будет использовать тип Array(Dynamic) для JSON массивов со значениями разных типов данных.

Пример:

SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=1;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');
┌─name─┬─type───────────┐
│ a    │ Array(Dynamic) │
└──────┴────────────────┘
SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=0;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');
┌─name─┬─type─────────────────────────────────────────────────────────────┐
│ a    │ Tuple(Nullable(Int64), Nullable(String), Array(Nullable(Int64))) │
└──────┴──────────────────────────────────────────────────────────────────┘

Включено по умолчанию.

input_format_json_infer_incomplete_types_as_strings

Позволяет использовать тип String для JSON ключей, которые содержат только Null/{}/[] в образце данных при выводе схемы. В JSON форматах любое значение может быть прочитано как строка, и мы можем избежать ошибок, таких как Невозможно определить тип для колонки 'column_name' по первым 25000 строкам данных, скорее всего эта колонка содержит только Null или пустые массивы/maps, при выводе схемы, используя строковый тип для ключей с неизвестными типами.

Пример:

SET input_format_json_infer_incomplete_types_as_strings = 1, input_format_json_try_infer_named_tuples_from_objects = 1;
DESCRIBE format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
SELECT * FROM format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');

Результат:

┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj  │ Tuple(a Array(Nullable(Int64)), b Nullable(String), c Nullable(String), d Nullable(String), e Array(Nullable(String))) │              │                    │         │                  │                │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘

┌─obj────────────────────────────┐
│ ([1,2,3],'hello',NULL,'{}',[]) │
└────────────────────────────────┘

Включено по умолчанию.

input_format_json_map_as_array_of_tuples

Десериализовать колонки map как JSON массивы кортежей.

Отключено по умолчанию.

input_format_json_max_depth

Максимальная глубина поля в JSON. Это не строгий предел, он не обязательно должен применяться строго.

input_format_json_named_tuples_as_objects

Парсить колонки именованных кортежей как JSON объекты.

Включено по умолчанию.

input_format_json_read_arrays_as_strings

Разрешить парсинг JSON массивов как строк в форматах ввода JSON.

Пример:

SET input_format_json_read_arrays_as_strings = 1;
SELECT arr, toTypeName(arr), JSONExtractArrayRaw(arr)[3] from format(JSONEachRow, 'arr String', '{"arr" : [1, "Hello", [1,2,3]]}');

Результат:

┌─arr───────────────────┬─toTypeName(arr)─┬─arrayElement(JSONExtractArrayRaw(arr), 3)─┐
│ [1, "Hello", [1,2,3]] │ String          │ [1,2,3]                                   │
└───────────────────────┴─────────────────┴───────────────────────────────────────────┘

Включено по умолчанию.

input_format_json_read_bools_as_numbers

Разрешить парсинг булевых значений как чисел в форматах ввода JSON.

Включено по умолчанию.

input_format_json_read_bools_as_strings

Разрешить парсинг булевых значений как строк в форматах ввода JSON.

Включено по умолчанию.

input_format_json_read_numbers_as_strings

Разрешить парсинг чисел как строк в форматах ввода JSON.

Включено по умолчанию.

input_format_json_read_objects_as_strings

Разрешить парсинг JSON объектов как строк в форматах ввода JSON.

Пример:

SET input_format_json_read_objects_as_strings = 1;
CREATE TABLE test (id UInt64, obj String, date Date) ENGINE=Memory();
INSERT INTO test FORMAT JSONEachRow {"id" : 1, "obj" : {"a" : 1, "b" : "Hello"}, "date" : "2020-01-01"};
SELECT * FROM test;

Результат:

┌─id─┬─obj──────────────────────┬───────date─┐
│  1 │ {"a" : 1, "b" : "Hello"} │ 2020-01-01 │
└────┴──────────────────────────┴────────────┘

Включено по умолчанию.

input_format_json_throw_on_bad_escape_sequence

Сгенерировать исключение, если строка JSON содержит недопустимую последовательность экранирования в форматах ввода JSON. Если отключено, недопустимые последовательности экранирования останутся неизменными в данных.

Включено по умолчанию.

input_format_json_try_infer_named_tuples_from_objects

Если включено, при выводе схемы ClickHouse будет пытаться вывести именованный кортеж из JSON объектов. Результирующий именованный кортеж будет содержать все элементы из всех соответствующих JSON объектов из образца данных.

Пример:

SET input_format_json_try_infer_named_tuples_from_objects = 1;
DESC format(JSONEachRow, '{"obj" : {"a" : 42, "b" : "Hello"}}, {"obj" : {"a" : 43, "c" : [1, 2, 3]}}, {"obj" : {"d" : {"e" : 42}}}')

Результат:

┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj  │ Tuple(a Nullable(Int64), b Nullable(String), c Array(Nullable(Int64)), d Tuple(e Nullable(Int64))) │              │                    │         │                  │                │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘

Включено по умолчанию.

input_format_json_try_infer_numbers_from_strings

Если включено, при выводе схемы ClickHouse будет пытаться вывести числа из строковых полей. Это может быть полезно, если данные JSON содержат заключенные в кавычки числа UInt64.

Отключено по умолчанию.

input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects

Использовать строковый тип вместо исключения в случае неоднозначных путей в JSON объектах при выводе именованных кортежей.

input_format_json_validate_types_from_metadata

Для форматов ввода JSON/JSONCompact/JSONColumnsWithMetadata, если эта настройка установлена в 1, типы из метаданных входных данных будут сравниваться с типами соответствующих колонок из таблицы.

Включено по умолчанию.

input_format_max_block_size_bytes

Ограничивает размер блоков, формируемых при парсинге данных в форматах ввода в байтах. Используется в форматах ввода, основанных на строках, когда блок формируется на стороне ClickHouse. 0 означает отсутствие ограничения в байтах.

input_format_max_bytes_to_read_for_schema_inference

Максимальное количество данных в байтах для автоматического вывода схемы.

input_format_max_rows_to_read_for_schema_inference

Максимальное количество строк данных для автоматического вывода схемы.

input_format_msgpack_number_of_columns

Количество колонок в вставленных данных MsgPack. Используется для автоматического вывода схемы из данных.

input_format_mysql_dump_map_column_names

Сопоставить колонки из таблицы в дампе MySQL и колонки из таблицы ClickHouse по именам.

input_format_mysql_dump_table_name

Имя таблицы в дампе MySQL, откуда считывать данные.

input_format_native_allow_types_conversion

Разрешить преобразование типов данных в формате ввода Native.

input_format_native_decode_types_in_binary_format

Читать типы данных в бинарном формате вместо имен типов в формате ввода Native.

input_format_null_as_default

Включает или отключает инициализацию полей NULL значениями по умолчанию, если тип данных этих полей не Nullable. Если тип колонки не разрешает null, и эта настройка отключена, тогда вставка NULL вызывает исключение. Если тип колонки допускает null, то значения NULL вставляются как есть, независимо от этой настройки.

Эта настройка применима для большинства форматов ввода.

Для сложных выражений по умолчанию input_format_defaults_for_omitted_fields также должно быть включено.

Возможные значения:

  • 0 — Вставка NULL в ненулевую колонку вызывает исключение.
  • 1 — Поля NULL инициализируются значениями по умолчанию колонок.

input_format_orc_allow_missing_columns

Разрешить отсутствующие колонки при чтении форматов ввода ORC.

input_format_orc_case_insensitive_column_matching

Игнорировать регистр при сопоставлении столбцов ORC с столбцами CH.

input_format_orc_dictionary_as_low_cardinality

Обрабатывать закодированные словарем столбцы ORC как столбцы LowCardinality при чтении файлов ORC.

input_format_orc_filter_push_down

При чтении файлов ORC пропускать целые полосы или группы строк на основе выражений WHERE/PREWHERE, статистики min/max или фильтра Блума в метаданных ORC.

input_format_orc_reader_time_zone_name

Имя часового пояса для считывателя строк ORC, по умолчанию часовой пояс считывателя строк ORC GMT.

input_format_orc_row_batch_size

Размер пакета при чтении полос ORC.

input_format_orc_skip_columns_with_unsupported_types_in_schema_inference

Пропускать столбцы с неподдерживаемыми типами при выводе схемы для формата ORC.

input_format_orc_use_fast_decoder

Использовать более быструю реализацию декодера ORC.

input_format_parquet_allow_geoparquet_parser

Использовать парсер геоколонок для преобразования Array(UInt8) в типы Point/Linestring/Polygon/MultiLineString/MultiPolygon.

input_format_parquet_allow_missing_columns

Разрешить отсутствие столбцов при чтении входных форматов Parquet.

input_format_parquet_bloom_filter_push_down

При чтении файлов Parquet пропускать целые группы строк на основе выражений WHERE и фильтра Блума в метаданных Parquet.

input_format_parquet_case_insensitive_column_matching

Игнорировать регистр при сопоставлении столбцов Parquet с столбцами CH.

input_format_parquet_enable_json_parsing

При чтении файлов Parquet парсить JSON-столбцы как JSON-столбцы ClickHouse.

input_format_parquet_enable_row_group_prefetch

Включить предзагрузку групп строк во время парсинга Parquet. В настоящее время только однопоточный парсинг может предзагружать.

input_format_parquet_filter_push_down

При чтении файлов Parquet пропускать целые группы строк на основе выражений WHERE/PREWHERE и статистики min/max в метаданных Parquet.

input_format_parquet_local_file_min_bytes_for_seek

Минимальное количество байт, необходимое для локального чтения (файла) для выполнения поиска, вместо чтения с игнорированием в формате входных данных Parquet.

input_format_parquet_max_block_size

Максимальный размер блока для считывателя Parquet.

input_format_parquet_memory_high_watermark

Приблизительный лимит памяти для считывателя Parquet v3. Ограничивает, сколько групп строк или столбцов можно прочитать параллельно. При чтении нескольких файлов в одном запросе, лимит касается общего использования памяти для этих файлов.

input_format_parquet_memory_low_watermark

Запланировать предзагрузки более агрессивно, если использование памяти ниже порога. Потенциально полезно, например, если нужно прочитать много небольших фильтров Блума по сети.

input_format_parquet_page_filter_push_down

Пропускать страницы, используя значения min/max из индексных столбцов.

input_format_parquet_prefer_block_bytes

Средний размер блока, выводимый считывателем Parquet.

input_format_parquet_preserve_order

Избегать переупорядочивания строк при чтении из файлов Parquet. Не рекомендуется, так как порядок строк обычно не гарантируется, и другие части конвейера запроса могут нарушить его. Используйте ORDER BY _row_number вместо этого.

input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference

Пропускать столбцы с неподдерживаемыми типами при выводе схемы для формата Parquet.

input_format_parquet_use_native_reader

Использовать нативный считыватель Parquet v1. Он относительно быстрый, но незавершенный. Устарел.

input_format_parquet_use_native_reader_v3 {#input_format_parquet_use_native_reader_v3}
Experimental feature. Learn more.

Использовать считыватель Parquet v3. Экспериментально.

input_format_parquet_use_offset_index

Незначительное изменение того, как страницы считываются из файла Parquet, когда фильтрация страниц не используется.

input_format_protobuf_flatten_google_wrappers

Включить обертки Google для обычных ненестированных столбцов, например, google.protobuf.StringValue 'str' для столбца String 'str'. Для Nullable столбцов пустые обертки распознаются как значения по умолчанию, а отсутствующие как null.

input_format_protobuf_oneof_presence

Указать, какое поле protobuf oneof было найдено, установив значение перечисления в специальный столбец.

input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference

Пропускать поля с неподдерживаемыми типами при выводе схемы для формата Protobuf.

input_format_record_errors_file_path

Путь к файлу, который используется для записи ошибок при чтении текстовых форматов (CSV, TSV).

input_format_skip_unknown_fields

Включает или отключает пропуск вставки дополнительных данных.

При записи данных ClickHouse выдает исключение, если входные данные содержат столбцы, которые отсутствуют в целевой таблице. Если пропуск включен, ClickHouse не вставляет дополнительные данные и не выдает исключение.

Поддерживаемые форматы:

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

input_format_try_infer_dates

Если включено, ClickHouse попытается вывести тип Date из строковых полей при выводе схемы для текстовых форматов. Если все поля из столбца во входных данных были успешно распознаны как даты, то результирующий тип будет Date, если хотя бы одно поле не было распознано как дата, то результирующий тип будет String.

Включено по умолчанию.

input_format_try_infer_datetimes

Если включено, ClickHouse попытается вывести тип DateTime64 из строковых полей при выводе схемы для текстовых форматов. Если все поля из столбца во входных данных были успешно распознаны как даты и времени, то результирующий тип будет DateTime64, если хотя бы одно поле не было распознано как дата и время, то результирующий тип будет String.

Включено по умолчанию.

input_format_try_infer_datetimes_only_datetime64

Когда input_format_try_infer_datetimes включен, выводить только DateTime64, но не типы DateTime.

input_format_try_infer_exponent_floats

Пытаться выводить дробные числа в экспоненциальной нотации при выводе схемы в текстовых форматах (кроме JSON, где экспоненциальные числа всегда выводятся).

input_format_try_infer_integers

Если включено, ClickHouse попытается вывести целые числа вместо дробных при выводе схемы для текстовых форматов. Если все числа в столбце во входных данных целые, то результирующий тип будет Int64, если хотя бы одно число дробное, то результирующий тип будет Float64.

Включено по умолчанию.

input_format_try_infer_variants

Если включено, ClickHouse попытается вывести тип Variant при выводе схемы для текстовых форматов, когда существует более одного возможного типа для элементов столбца/массива.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

input_format_tsv_allow_variable_number_of_columns

Игнорировать дополнительные столбцы в входном формате TSV (если файл имеет больше столбцов, чем ожидалось) и рассматривать отсутствующие поля во входном формате TSV как значения по умолчанию.

input_format_tsv_crlf_end_of_line

Если это значение установлено в true, функция файла будет читать формат TSV с \r\n вместо \n.

input_format_tsv_detect_header

Автоматически обнаруживать заголовок с именами и типами в формате TSV.

input_format_tsv_empty_as_default

Рассматривать пустые поля во входном формате TSV как значения по умолчанию.

input_format_tsv_enum_as_number

Обрабатывать вставляемые значения перечисления в форматах TSV как индексы перечисления.

input_format_tsv_skip_first_lines

Пропускать указанное количество строк в начале данных в формате TSV.

input_format_tsv_skip_trailing_empty_lines

Пропускать завершающие пустые строки в формате TSV.

input_format_tsv_use_best_effort_in_schema_inference

Использовать некоторые настройки и эвристики для вывода схемы в формате TSV.

input_format_values_accurate_types_of_literals

Для формата Values: при парсинге и интерпретации выражений, используя шаблон, проверять фактический тип литерала, чтобы избежать возможных переполнений и проблем с точностью.

input_format_values_deduce_templates_of_expressions

Для формата Values: если поле не удалось распознать с помощью потокового парсера, запустить SQL-парсер, вывести шаблон SQL-выражения, попытаться распознать все строки с использованием шаблона, а затем интерпретировать выражение для всех строк.

input_format_values_interpret_expressions

Для формата Values: если поле не удалось распознать с помощью потокового парсера, запустить SQL-парсер и попытаться интерпретировать его как SQL-выражение.

input_format_with_names_use_header

Включает или отключает проверку порядка столбцов при вставке данных.

Для улучшения производительности вставки мы рекомендуем отключить эту проверку, если вы уверены, что порядок столбцов входных данных совпадает с порядком в целевой таблице.

Поддерживаемые форматы:

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

input_format_with_types_use_header

Контролирует, должен ли парсер формата проверять, соответствуют ли типы данных из входных данных типам данных из целевой таблицы.

Поддерживаемые форматы:

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

insert_distributed_one_random_shard

Включает или отключает случайную вставку в шард в таблицу Distributed, когда отсутствует распределенный ключ.

По умолчанию, при вставке данных в таблицу Distributed с более чем одним шардом, сервер ClickHouse отклоняет любой запрос на вставку, если не задан распределенный ключ. Когда insert_distributed_one_random_shard = 1, вставки разрешены и данные передаются случайным образом между всеми шардом.

Возможные значения:

  • 0 — Вставка отклоняется, если имеется несколько шардов и не указан распределенный ключ.
  • 1 — Вставка производится случайным образом среди всех доступных шардов, когда не указан распределенный ключ.

interval_output_format

Разрешает выбирать различные форматы вывода текстового представления типов интервалов.

Возможные значения:

  • kusto - выходной формат в стиле KQL.

    ClickHouse выводит интервалы в формате KQL. Например, toIntervalDay(2) будет отформатирован как 2.00:00:00. Обратите внимание, что для типов интервалов переменной длины (т.е. IntervalMonth и IntervalYear) учитывается среднее количество секунд на интервал.

  • numeric - числовой выходной формат.

    ClickHouse выводит интервалы как их базовое числовое представление. Например, toIntervalDay(2) будет отформатирован как 2.

См. также:

json_type_escape_dots_in_keys

Когда включено, точки в ключах JSON будут экранированы во время парсинга.

output_format_arrow_compression_method

Метод сжатия для формата вывода Arrow. Поддерживаемые кодеки: lz4_frame, zstd, none (несжатый).

output_format_arrow_fixed_string_as_fixed_byte_array

Использовать тип Arrow FIXED_SIZE_BINARY вместо Binary для столбцов FixedString.

output_format_arrow_low_cardinality_as_dictionary

Включить вывод типа LowCardinality в качестве типа словаря Arrow.

output_format_arrow_string_as_string

Использовать тип Arrow String вместо Binary для столбцов String.

output_format_arrow_use_64_bit_indexes_for_dictionary

Всегда использовать 64-битные целые числа для индексов словарей в формате Arrow.

output_format_arrow_use_signed_indexes_for_dictionary

Использовать знаковые целые числа для индексов словарей в формате Arrow.

output_format_avro_codec

Кодек сжатия, используемый для вывода. Возможные значения: 'null', 'deflate', 'snappy', 'zstd'.

output_format_avro_rows_in_file

Максимальное количество строк в файле (если разрешено хранилищем).

output_format_avro_string_column_pattern

Для формата Avro: регулярное выражение для выборки строковых столбцов в качестве AVRO строк.

output_format_avro_sync_interval

Интервал синхронизации в байтах.

output_format_binary_encode_types_in_binary_format

Записывать типы данных в двоичном формате вместо имен типов в формате RowBinaryWithNamesAndTypes.

output_format_binary_write_json_as_string

Записывать значения типа JSON в формате строк String в формате RowBinary.

output_format_bson_string_as_string

Использовать тип BSON String вместо Binary для столбцов String.

output_format_csv_crlf_end_of_line

Если это значение установлено в true, конец строки в формате CSV будет \r\n вместо \n.

output_format_csv_serialize_tuple_into_separate_columns

Если это значение установлено в true, то кортежи в формате CSV сериализуются как отдельные столбцы (то есть их вложенность в кортеже теряется).

output_format_decimal_trailing_zeros

Выводить конечные нули при печати значений Decimal. Например, 1.230000 вместо 1.23.

Отключено по умолчанию.

output_format_json_array_of_rows

Включает возможность вывода всех строк в виде JSON массива в формате JSONEachRow.

Возможные значения:

  • 1 — ClickHouse выводит все строки как массив, каждая строка в формате JSONEachRow.
  • 0 — ClickHouse выводит каждую строку отдельно в формате JSONEachRow.

Пример запроса с включенной настройкой

Запрос:

SET output_format_json_array_of_rows = 1;
SELECT number FROM numbers(3) FORMAT JSONEachRow;

Результат:

[
{"number":"0"},
{"number":"1"},
{"number":"2"}
]

Пример запроса с отключенной настройкой

Запрос:

SET output_format_json_array_of_rows = 0;
SELECT number FROM numbers(3) FORMAT JSONEachRow;

Результат:

{"number":"0"}
{"number":"1"}
{"number":"2"}

output_format_json_escape_forward_slashes

Контролирует экранирование прямых слэшей при выводе строк в формате JSON. Это предназначено для совместимости с JavaScript. Не путать со слэшами, которые всегда экранируются.

Включено по умолчанию.

output_format_json_map_as_array_of_tuples

Сериализовать столбцы карты как JSON массивы кортежей.

Отключено по умолчанию.

output_format_json_named_tuples_as_objects

Сериализовать столбцы именованных кортежей как JSON объекты.

Включено по умолчанию.

output_format_json_pretty_print

Эта настройка определяет, как отображаются вложенные структуры, такие как кортежи, карты и массивы, внутри массива data при использовании формата вывода JSON.

Например, вместо вывода:

"data":
[
  {
    "tuple": {"a":1,"b":2,"c":3},
    "array": [1,2,3],
    "map": {"a":1,"b":2,"c":3}
  }
],

Вывод будет отформатирован как:

"data":
[
    {
        "tuple": {
            "a": 1,
            "b": 2,
            "c": 3
        },
        "array": [
            1,
            2,
            3
        ],
        "map": {
            "a": 1,
            "b": 2,
            "c": 3
        }
    }
],

Включено по умолчанию.

output_format_json_quote_64bit_floats

Контролирует экранирование 64-битных чисел с плавающей запятой при выводе в формате JSON.

Отключено по умолчанию.

output_format_json_quote_64bit_integers

Контролирует экранирование 64-битных или больших целых чисел (например, UInt64 или Int128) при выводе в формате JSON. Такие целые числа по умолчанию заключаются в кавычки. Это поведение совместимо с большинством реализаций JavaScript.

Возможные значения:

  • 0 — Целые числа выводятся без кавычек.
  • 1 — Целые числа заключаются в кавычки.

output_format_json_quote_decimals

Контролирует экранирование десятичных значений в форматах вывода JSON.

Отключено по умолчанию.

output_format_json_quote_denormals

Включает выводы +nan, -nan, +inf, -inf в формате JSON.

Возможные значения:

  • 0 — Отключено.
  • 1 — Включено.

Пример

Рассмотрим следующую таблицу account_orders:

┌─id─┬─name───┬─duration─┬─period─┬─area─┐
│  1 │ Andrew │       20 │      0 │  400 │
│  2 │ John   │       40 │      0 │    0 │
│  3 │ Bob    │       15 │      0 │ -100 │
└────┴────────┴──────────┴────────┴──────┘

Когда output_format_json_quote_denormals = 0, запрос возвращает значения null в выводе:

SELECT area/period FROM account_orders FORMAT JSON;
{
        "meta":
        [
                {
                        "name": "divide(area, period)",
                        "type": "Float64"
                }
        ],

        "data":
        [
                {
                        "divide(area, period)": null
                },
                {
                        "divide(area, period)": null
                },
                {
                        "divide(area, period)": null
                }
        ],

        "rows": 3,

        "statistics":
        {
                "elapsed": 0.003648093,
                "rows_read": 3,
                "bytes_read": 24
        }
}

Когда output_format_json_quote_denormals = 1, запрос возвращает:

{
        "meta":
        [
                {
                        "name": "divide(area, period)",
                        "type": "Float64"
                }
        ],

        "data":
        [
                {
                        "divide(area, period)": "inf"
                },
                {
                        "divide(area, period)": "-nan"
                },
                {
                        "divide(area, period)": "-inf"
                }
        ],

        "rows": 3,

        "statistics":
        {
                "elapsed": 0.000070241,
                "rows_read": 3,
                "bytes_read": 24
        }
}

output_format_json_skip_null_value_in_named_tuples

Пропускать пары ключ-значение с нулевым значением при сериализации столбцов именованных кортежей как JSON объекты. Это имеет смысл только тогда, когда output_format_json_named_tuples_as_objects равно true.

output_format_json_validate_utf8

Контролирует проверку последовательностей UTF-8 в форматах вывода JSON, не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata, они всегда проверяют UTF-8.

Отключено по умолчанию.

output_format_markdown_escape_special_characters

Когда включено, экранировать специальные символы в Markdown.

Common Mark определяет следующие специальные символы, которые могут быть экранированы с помощью :

! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~

Возможные значения:

  • 0 — Отключить.
  • 1 — Включить.

output_format_msgpack_uuid_representation

Способ вывода UUID в формате MsgPack.

output_format_native_encode_types_in_binary_format

Записывать типы данных в двоичном формате вместо имен типов в нативном формате.

output_format_native_use_flattened_dynamic_and_json_serialization

Записывать данные из столбцов JSON и Dynamic в упрощенном формате (все типы/пути как отдельные подстолбцы).

output_format_native_write_json_as_string

Записывать данные из столбца JSON как столбец String, содержащий JSON строки вместо стандартной нативной сериализации JSON.

output_format_orc_compression_block_size

Размер блока сжатия в байтах для формата вывода ORC.

output_format_orc_compression_method

Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (несжатый).

output_format_orc_dictionary_key_size_threshold

Для строкового столбца в формате вывода ORC, если число уникальных значений превышает эту долю от общего числа ненулевых строк, отключить кодирование словаря. В противном случае кодирование словаря включается.

output_format_orc_row_index_stride

Целевая ширина индекса строк в формате вывода ORC.

output_format_orc_string_as_string

Использовать тип ORC String вместо Binary для столбцов String.

output_format_orc_writer_time_zone_name

Имя часового пояса для писателя ORC, по умолчанию часовой пояс писателя ORC GMT.

output_format_parquet_batch_size

Проверяйте размер страницы после каждого указанного количества строк. Рассмотрите возможность уменьшения, если у вас есть столбцы со средним размером значений выше нескольких КБ.

output_format_parquet_bloom_filter_bits_per_value

Приблизительное количество бит, используемых для каждого уникального значения в фильтрах Блума Parquet. Оценочные показатели ложных срабатываний:

  • 6 бит - 10%
  • 10.5 бит - 1%
  • 16.9 бит - 0.1%
  • 26.4 бит - 0.01%
  • 41 бит - 0.001%

output_format_parquet_bloom_filter_flush_threshold_bytes

Где в файле Parquet разместить фильтры Блума. Фильтры Блума будут записываться группами приблизительно такого размера. В частности:

  • если 0, фильтры Блума каждой группы строк записываются сразу после группы строк,
  • если больше, чем общий размер всех фильтров Блума, фильтры Блума для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
  • иначе, фильтры Блума будут накапливаться в памяти и записываться в момент, когда их общий размер превысит это значение.

output_format_parquet_compliant_nested_types

В схеме файла Parquet использовать имя 'element' вместо 'item' для элементов списка. Это исторический артефакт реализации библиотеки Arrow. В целом повышает совместимость, за исключением, возможно, некоторых старых версий Arrow.

output_format_parquet_compression_method

Метод сжатия для формата вывода Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (несжатый).

output_format_parquet_data_page_size

Целевой размер страницы в байтах до сжатия.

output_format_parquet_date_as_uint16

Записывать значения Даты как простые 16-битные числа (читать обратно как UInt16), вместо преобразования в 32-битный тип даты Parquet (читать обратно как Date32).

output_format_parquet_datetime_as_uint32

Записывать значения DateTime как сырой временной штамп Unix (читать назад как UInt32), вместо преобразования в миллисекунды (читать назад как DateTime64(3)).

output_format_parquet_enum_as_byte_array

Записывать перечисление, используя физический тип Parquet: BYTE_ARRAY и логический тип: ENUM.

output_format_parquet_fixed_string_as_fixed_byte_array

Использовать тип Parquet FIXED_LENGTH_BYTE_ARRAY вместо Binary для столбцов FixedString.

output_format_parquet_geometadata

Разрешить записывать информацию о геоколонках в метаданные parquest и кодировать столбцы в формате WKB.

output_format_parquet_max_dictionary_size

Если размер словаря становится больше этого количества байт, переключиться на кодирование без словаря. Установите в 0, чтобы отключить кодирование словаря.

output_format_parquet_parallel_encoding

Выполнять кодирование Parquet в нескольких потоках. Требуется output_format_parquet_use_custom_encoder.

output_format_parquet_row_group_size

Целевой размер группы строк в строках.

output_format_parquet_row_group_size_bytes

Целевой размер группы строк в байтах до сжатия.

output_format_parquet_string_as_string

Использовать тип Parquet String вместо Binary для столбцов String.

output_format_parquet_use_custom_encoder

Использовать более быструю реализацию кодировщика Parquet.

output_format_parquet_version

Версия формата Parquet для формата вывода. Поддерживаемые версии: 1.0, 2.4, 2.6 и 2.последняя (по умолчанию).

output_format_parquet_write_bloom_filter

Записывать фильтры Блума в файлы Parquet. Требует output_format_parquet_use_custom_encoder = true.

output_format_parquet_write_page_index

Записывать индекс столбца и индекс смещения (т.е. статистику о каждой странице данных, которая может быть использована для фильтрации при чтении) в файлы Parquet.

output_format_pretty_color

Использовать ANSI-escape последовательности в красивых форматах. 0 - отключено, 1 - включено, 'auto' - включено, если терминал.

Отображать имена столбцов в нижнем колонтитуле, если имеется много строк таблицы.

Возможные значения:

  • 0 — Имена столбцов не отображаются в нижнем колонтитуле.
  • 1 — Имена столбцов отображаются в нижнем колонтитуле, если количество строк больше или равно пороговому значению, установленному output_format_pretty_display_footer_column_names_min_rows (по умолчанию 50).

Пример

Запрос:

SELECT *, toTypeName(*) FROM (SELECT * FROM system.numbers LIMIT 1000);

Результат:

      ┌─number─┬─toTypeName(number)─┐
   1. │      0 │ UInt64             │
   2. │      1 │ UInt64             │
   3. │      2 │ UInt64             │
   ...
 999. │    998 │ UInt64             │
1000. │    999 │ UInt64             │
      └─number─┴─toTypeName(number)─┘

Устанавливает минимальное количество строк, для которого будет отображаться подвал с именами колонок, если включена настройка output_format_pretty_display_footer_column_names.

output_format_pretty_fallback_to_vertical

Если включено, и таблица широкая, но короткая, то формат Pretty будет выводиться так же, как вертикальный формат. Смотрите output_format_pretty_fallback_to_vertical_max_rows_per_chunk и output_format_pretty_fallback_to_vertical_min_table_width для детальной настройки этого поведения.

output_format_pretty_fallback_to_vertical_max_rows_per_chunk

Падение на вертикальный формат (см. output_format_pretty_fallback_to_vertical) будет активировано только если количество записей в фрагменте не больше указанного значения.

output_format_pretty_fallback_to_vertical_min_columns

Падение на вертикальный формат (см. output_format_pretty_fallback_to_vertical) будет активировано только если количество колонок больше заданного значения.

output_format_pretty_fallback_to_vertical_min_table_width

Падение на вертикальный формат (см. output_format_pretty_fallback_to_vertical) будет активировано только если сумма длин колонок в таблице не менее указанного значения, или если хотя бы одно значение содержит символ новой строки.

output_format_pretty_glue_chunks

Если данные, отображаемые в форматах Pretty, пришли в нескольких фрагментах, даже с задержкой, но следующий фрагмент имеет такие же ширины колонок, как предыдущий, используйте ANSI escape последовательности для возврата к предыдущей строке и перезаписи подвала предыдущего фрагмента, чтобы продолжить с данными нового фрагмента. Это делает результат более визуально приятным.

0 - отключено, 1 - включено, 'auto' - включено, если это терминал.

output_format_pretty_grid_charset

Кодировка для печати границ сетки. Доступные кодировки: ASCII, UTF-8 (по умолчанию).

output_format_pretty_highlight_digit_groups

Если включено и вывод осуществляется в терминал, выделяйте каждую цифру, соответствующую числу тысяч, миллионов и т. д., подчеркиванием.

output_format_pretty_highlight_trailing_spaces

Если включено и вывод осуществляется в терминал, выделяйте пробелы в конце строк серым цветом и подчеркиванием.

output_format_pretty_max_column_name_width_cut_to

Если имя колонки слишком длинное, обрежьте его до этой длины. Колонка будет обрезана, если она длиннее output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_name_width_min_chars_to_cut

Минимальное количество символов для обрезания, если имя колонки слишком длинное. Колонка будет обрезана, если она длиннее output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_pad_width

Максимальная ширина для заполнения всех значений в колонке в форматах Pretty.

output_format_pretty_max_rows

Лимит строк для форматов Pretty.

output_format_pretty_max_value_width

Максимальная ширина значения, отображаемого в форматах Pretty. Если больше - будет обрезано. Значение 0 означает - никогда не обрезать.

output_format_pretty_max_value_width_apply_for_single_value

Обрежьте значения (см. настройку output_format_pretty_max_value_width) только тогда, когда это не единственное значение в блоке. В противном случае выводите полностью, что полезно для запроса SHOW CREATE TABLE.

output_format_pretty_multiline_fields

Если включено, форматы Pretty будут отображать многострочные поля внутри ячейки таблицы, поэтому контур таблицы будет сохранен. Если нет, они будут отображаться как есть, что может деформировать таблицу (одним из преимуществ отключения является то, что копирование и вставка многострочных значений будет проще).

output_format_pretty_row_numbers

Добавьте номера строк перед каждой строкой для формата вывода pretty.

output_format_pretty_single_large_number_tip_threshold

Распечатайте понятное число рядом с таблицей, если блок состоит из единственного числа, которое превышает это значение (кроме 0).

output_format_pretty_squash_consecutive_ms

Ожидайте следующий блок до указанного числа миллисекунд и объединяйте его с предыдущим перед записью. Это позволяет избежать частого вывода слишком маленьких блоков, но все же позволяет отображать данные в потоковом режиме.

output_format_pretty_squash_max_wait_ms

Выводите ожидающий блок в форматах pretty, если прошло более указанного числа миллисекунд с момента предыдущего вывода.

output_format_protobuf_nullables_with_google_wrappers

При сериализации Nullable колонок с обертками Google сериализуйте значения по умолчанию как пустые обертки. Если отключено, значения по умолчанию и null не сериализуются.

output_format_schema

Путь к файлу, где будет сохранена автоматически сгенерированная схема в форматах Cap'n Proto или Protobuf.

output_format_sql_insert_include_column_names

Включить имена колонок в запросе INSERT.

output_format_sql_insert_max_batch_size

Максимальное количество строк в одном операторе INSERT.

output_format_sql_insert_quote_names

Цитировать имена колонок с символами '`'.

output_format_sql_insert_table_name

Имя таблицы в выходном запросе INSERT.

output_format_sql_insert_use_replace

Использовать оператор REPLACE вместо INSERT.

output_format_tsv_crlf_end_of_line

Если установлено в true, конец строки в формате TSV будет \r\n вместо \n.

output_format_values_escape_quote_with_quote

Если true, экранировать ' с '', в противном случае заключать в \'

output_format_write_statistics

Записывать статистику о прочитанных строках, байтах, времени выполнения в подходящих форматах вывода.

Включено по умолчанию.

precise_float_parsing

Предпочитать более точный (но медленный) алгоритм разбора float.

regexp_dict_allow_hyperscan

Разрешить словарь regexp_tree с использованием библиотеки Hyperscan.

regexp_dict_flag_case_insensitive

Использовать нечувствительное к регистру сопоставление для словаря regexp_tree. Может быть переопределено в отдельных выражениях с помощью (?i) и (?-i).

regexp_dict_flag_dotall

Разрешить '.' соответствовать символам новой строки для словаря regexp_tree.

rows_before_aggregation

При включении ClickHouse будет предоставлять точное значение для статистики rows_before_aggregation, представляющей количество строк, прочитанных до агрегации.

schema_inference_hints

Список имен колонок и типов для использования в качестве подсказок в выводе схемы для форматов без схемы.

Пример:

Запрос:

desc format(JSONEachRow, '{"x" : 1, "y" : "String", "z" : "0.0.0.0" }') settings schema_inference_hints='x UInt8, z IPv4';

Результат:

x   UInt8
y   Nullable(String)
z   IPv4
примечание

Если schema_inference_hints не отформатирован должным образом, или если есть опечатка или неправильный тип данных и т. д., вся подсказка schema_inference_hints будет проигнорирована.

schema_inference_make_columns_nullable

Управляет преобразованием выведенных типов в Nullable в выводе схемы. Возможные значения:

  • 0 - выведенный тип никогда не будет Nullable (используйте input_format_null_as_default для управления тем, что делать с null значениями в этом случае),
  • 1 - все выведенные типы будут Nullable,
  • 2 или auto - выведенный тип будет Nullable только если колонка содержит NULL в выборке, которая разбирается во время вывода схемы, или метаданные файла содержат информацию о допустимости null для колонки,
  • 3 - допустимость null для выведенного типа будет соответствовать метаданным файла, если формат это имеет (например, Parquet), иначе всегда Nullable (например, CSV).

schema_inference_make_json_columns_nullable

Управляет преобразованием выведенных типов JSON в Nullable в выводе схемы. Если эта настройка включена вместе с schema_inference_make_columns_nullable, выведенный тип JSON будет Nullable.

schema_inference_mode

Режим вывода схемы. 'default' - предполагается, что все файлы имеют одинаковую схему и схема может быть выведена из любого файла, 'union' - файлы могут иметь разные схемы, и результирующая схема должна быть объединением схем всех файлов.

show_create_query_identifier_quoting_rule

Установите правило цитирования для идентификаторов в запросе SHOW CREATE.

show_create_query_identifier_quoting_style

Установите стиль цитирования для идентификаторов в запросе SHOW CREATE.

type_json_skip_duplicated_paths

Если включено, при разборе JSON объекта в тип JSON дублирующиеся пути будут игнорироваться, и только первый путь будет вставлен вместо исключения.

validate_experimental_and_suspicious_types_inside_nested_types

Проверять использование экспериментальных и подозрительных типов внутри вложенных типов, таких как Array/Map/Tuple