Настройки формата
Эти настройки автоматически созданы из source.
allow_special_bool_values_inside_variant
Позволяет парсить булевы значения внутри типа Variant из специальных текстовых булевых значений, таких как "on", "off", "enable", "disable" и т.д.
bool_false_representation
Текст для представления ложного булева значения в форматах TSV/CSV/Vertical/Pretty.
bool_true_representation
Текст для представления истинного булева значения в форматах TSV/CSV/Vertical/Pretty.
column_names_for_schema_inference
Список имен колонок, которые будут использоваться для вывода схемы для форматов без имен колонок. Формат: 'column1,column2,column3,...'
cross_to_inner_join_rewrite
Использовать внутреннее соединение вместо запятой/перекрестного соединения, если в разделе WHERE есть выражения соединения. Значения: 0 - без замены, 1 - применять, если возможно для запятой/перекрестного, 2 - принудительно заменить все запятые, cross - если возможно
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
Динамически обрезать конечные нули значений datetime64 для подгонки масштаба вывода к [0, 3, 6], соответствующие 'секундам', 'миллисекундам' и 'микросекундам'
date_time_input_format
Позволяет выбрать парсер текстового представления даты и времени.
Настройка не применяется к функциям даты и времени.
Возможные значения:
-
'best_effort'
— Включает расширенный парсинг.ClickHouse может парсить основной формат
YYYY-MM-DD HH:MM:SS
и все форматы даты и времени ISO 8601. Например,'2018-06-08T01:02:03.000Z'
. -
'best_effort_us'
— Аналогичноbest_effort
(см. различия в parseDateTimeBestEffortUS -
'basic'
— Использовать основной парсер.ClickHouse может парсить только основной формат
YYYY-MM-DD HH:MM:SS
илиYYYY-MM-DD
. Например,2019-08-20 10:18:56
или2019-08-20
.
Значение по умолчанию в облаке: 'best_effort'
.
Смотрите также:
date_time_output_format
Позволяет выбрать разные форматы вывода текстового представления даты и времени.
Возможные значения:
-
simple
- Простой формат вывода.ClickHouse выводит дату и время в формате
YYYY-MM-DD hh:mm:ss
. Например,2019-08-20 10:18:56
. Расчет производится в соответствии с временной зоной типа данных (если присутствует) или временной зоной сервера. -
iso
- ISO формат вывода.ClickHouse выводит дату и время в формате ISO 8601
YYYY-MM-DDThh:mm:ssZ
. Например,2019-08-20T10:18:56Z
. Обратите внимание, что вывод идет в UTC (Z
означает UTC). -
unix_timestamp
- Формат вывода Unix timestamp.ClickHouse выводит дату и время в формате Unix timestamp. Например,
1566285536
.
Смотрите также:
date_time_overflow_behavior
Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в целевом типе.
Возможные значения:
ignore
— Безмолвно игнорирует переполнения. Результаты неопределены.throw
— Генерирует исключение в случае переполнения.saturate
— Насыщает результат. Если значение меньше минимального значения, которое можно представить целевым типом, результат выбирается как минимальное представимое значение. Если значение больше максимального значения, которое можно представить целевым типом, результат выбирается как максимальное представимое значение.
Значение по умолчанию: ignore
.
dictionary_use_async_executor
Выполнять пайплайн для чтения источника словаря в несколько потоков. Поддерживается только словарями с локальным источником CLICKHOUSE.
errors_output_format
Метод записи ошибок в текстовый вывод.
exact_rows_before_limit
Когда включено, ClickHouse будет предоставлять точное значение для статистики rows_before_limit_at_least, но с тем ценой, что данные перед лимитом придется считать полностью.
format_avro_schema_registry_url
Для формата AvroConfluent: URL реестра схем Confluent.
format_binary_max_array_size
Максимально допустимый размер массива в формате RowBinary. Это предотвращает выделение большого объема памяти в случае поврежденных данных. 0 означает, что ограничений нет.
format_binary_max_string_size
Максимально допустимый размер строки в формате RowBinary. Это предотвращает выделение большого объема памяти в случае поврежденных данных. 0 означает, что ограничений нет.
format_capn_proto_enum_comparising_mode
Как сопоставить ClickHouse Enum и CapnProto Enum.
format_capn_proto_use_autogenerated_schema
Использовать автоматически сгенерированную схему CapnProto, когда format_schema не задан.
format_csv_allow_double_quotes
Если установлено в true, разрешить строки в двойных кавычках.
format_csv_allow_single_quotes
Если установлено в true, разрешить строки в одинарных кавычках.
format_csv_delimiter
Символ, который будет считаться разделителем в данных CSV. Если задана строка, строка должна иметь длину 1.
format_csv_null_representation
Пользовательское представление NULL в формате CSV.
format_custom_escaping_rule
Правило экранирования полей (для формата CustomSeparated).
format_custom_field_delimiter
Разделитель между полями (для формата CustomSeparated).
format_custom_result_after_delimiter
Суффикс после результата (для формата CustomSeparated).
format_custom_result_before_delimiter
Префикс перед результатом (для формата CustomSeparated).
format_custom_row_after_delimiter
Разделитель после поля последней колонки (для формата CustomSeparated).
format_custom_row_before_delimiter
Разделитель перед полем первой колонки (для формата CustomSeparated).
format_custom_row_between_delimiter
Разделитель между строками (для формата CustomSeparated).
format_display_secrets_in_show_and_select
Включает или отключает отображение секретов в запросах SHOW
и SELECT
для таблиц, баз данных, табличных функций и словарей.
Пользователь, желающий видеть секреты, также должен иметь включенными
display_secrets_in_show_and_select
серверную настройку
и привилегию
displaySecretsInShowAndSelect
.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
format_json_object_each_row_column_for_object_name
Имя колонки, которое будет использоваться для хранения/записи имен объектов в формате JSONObjectEachRow.
Тип колонки должен быть строковым. Если значение пустое, по умолчанию будут использоваться имена row_{i}
для имен объектов.
format_protobuf_use_autogenerated_schema
Использовать автоматически сгенерированный Protobuf, когда format_schema не задан.
format_regexp
Регулярное выражение (для формата Regexp).
format_regexp_escaping_rule
Правило экранирования полей (для формата Regexp).
format_regexp_skip_unmatched
Пропустить строки, которые не соответствуют регулярному выражению (для формата Regexp).
format_schema
Этот параметр полезен, когда вы используете форматы, которые требуют определения схемы, такие как Cap'n Proto или Protobuf. Значение зависит от формата.
format_schema_message_name
Определите имя необходимого сообщения в схеме, определенной в format_schema
.
Чтобы поддерживать совместимость с устаревшим форматом schema_schema (file_name:message_name
):
- Если
format_schema_message_name
не задано, имя сообщения выводится из частиmessage_name
устаревшего значенияformat_schema
. - Если
format_schema_message_name
задано при использовании устаревшего формата, будет вызвана ошибка.
format_schema_source
Определите источник format_schema
.
Возможные значения:
- 'file' (по умолчанию)::
format_schema
- это имя файла схемы, расположенного в каталогеformat_schemas
. - 'string':
format_schema
является буквальным содержимым схемы. - 'query':
format_schema
является запросом для получения схемы. Когдаformat_schema_source
установлено в 'query', применяются следующие условия: - Запрос должен возвращать строго одно значение: одну строку с единственной строковой колонкой.
- Результат запроса считается содержимым схемы.
- Этот результат кэшируется локально в каталоге
format_schemas
. - Вы можете очистить локальный кэш, используя команду:
SYSTEM DROP FORMAT SCHEMA CACHE FOR Files
. - После кэширования одинаковые запросы не выполняются для повторного получения схемы до тех пор, пока кэш не будет явно очищен.
- В дополнение к локальным кэшированным файлам, сообщения Protobuf также кэшируются в памяти. Даже после очистки локальных кэшированных файлов в памяти кэш должен быть очищен с помощью
SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf]
, чтобы полностью обновить схему. - Запустите запрос
SYSTEM DROP FORMAT SCHEMA CACHE
, чтобы очистить кеш как для кэшированных файлов, так и для схем сообщений Protobuf одновременно.
format_template_resultset
Путь к файлу, содержащему строку формата для результирующего набора (для формата Template).
format_template_resultset_format
Строка формата для результирующего набора (для формата Template).
format_template_row
Путь к файлу, содержащему строку формата для строк (для формата Template).
format_template_row_format
Строка формата для строк (для формата Template).
format_template_rows_between_delimiter
Разделитель между строками (для формата Template).
format_tsv_null_representation
Пользовательское представление NULL в формате TSV.
input_format_allow_errors_num
Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.д.).
Значение по умолчанию - 0.
Всегда сочетайте с input_format_allow_errors_ratio
.
Если ошибка произошла при чтении строк, но счетчик ошибок все еще меньше input_format_allow_errors_num
, ClickHouse игнорирует строку и переходит к следующей.
Если превышены как input_format_allow_errors_num
, так и input_format_allow_errors_ratio
, ClickHouse выдает исключение.
input_format_allow_errors_ratio
Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.д.). Процент ошибок устанавливается как число с плавающей точкой между 0 и 1.
Значение по умолчанию - 0.
Всегда сочетайте с input_format_allow_errors_num
.
Если ошибка произошла при чтении строк, но счетчик ошибок все еще меньше input_format_allow_errors_ratio
, ClickHouse игнорирует строку и переходит к следующей.
Если превышены как input_format_allow_errors_num
, так и input_format_allow_errors_ratio
, ClickHouse выдает исключение.
input_format_allow_seeks
Разрешить поиски при чтении в форматах ввода ORC/Parquet/Arrow.
Включено по умолчанию.
input_format_arrow_allow_missing_columns
Разрешить отсутствующие колонки при чтении в форматах ввода Arrow.
input_format_arrow_case_insensitive_column_matching
Игнорировать регистр при соответствии колонок Arrow и колонок CH.
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
Пропустить колонки с неподдерживаемыми типами при выводе схемы для формата Arrow.
input_format_avro_allow_missing_fields
Для формата Avro/AvroConfluent: когда поле не найдено в схеме, использовать значение по умолчанию вместо ошибки.
input_format_avro_null_as_default
Для формата Avro/AvroConfluent: вставить значение по умолчанию в случае null и не Nullable.
input_format_binary_decode_types_in_binary_format
Читать типы данных в бинарном формате вместо имен типов в формате ввода RowBinaryWithNamesAndTypes.
input_format_binary_read_json_as_string
Читать значения типа JSON как строки JSON String в формате RowBinary.
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
Пропустить поля с неподдерживаемыми типами при выводе схемы для формата BSON.
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
Пропустить колонки с неподдерживаемыми типами при выводе схемы для формата CapnProto.
input_format_csv_allow_cr_end_of_line
Если установлено в true, \r будет разрешено в конце строки без последующей
input_format_csv_allow_variable_number_of_columns
Игнорировать дополнительные колонки в формате ввода CSV (если файл имеет больше колонок, чем ожидалось) и считать отсутствующие поля в формате CSV значениями по умолчанию.
input_format_csv_allow_whitespace_or_tab_as_delimiter
Разрешить использовать пробелы и табуляции (\t) в качестве разделителей полей в строках CSV.
input_format_csv_arrays_as_nested_csv
При чтении массива из CSV ждать, что его элементы были сериализованы в вложенный CSV и затем помещены в строку. Пример: "[""Hello"", ""world"", ""42"""" TV""]". Скобки вокруг массива можно опустить.
input_format_csv_deserialize_separate_columns_into_tuple
Если установлено в true, тогда отдельные колонки, записанные в формате CSV, могут быть десериализованы в кортеж.
input_format_csv_detect_header
Автоматически обнаруживать заголовок с именами и типами в формате CSV.
input_format_csv_empty_as_default
Считать пустые поля в формате CSV значениями по умолчанию.
input_format_csv_enum_as_number
Считать вставленные значения enum в формате CSV как индексы enum.
input_format_csv_skip_first_lines
Пропустить указанное количество строк в начале данных в формате CSV.
input_format_csv_skip_trailing_empty_lines
Пропустить завершающие пустые строки в формате CSV.
input_format_csv_trim_whitespaces
Обрезать пробелы и символы табуляции (\t) в начале и конце строк CSV.
input_format_csv_try_infer_numbers_from_strings
Если включено, при выводе схемы ClickHouse будет пытаться вывести числа из строковых полей. Это может быть полезно, если данные в CSV содержат заключенные в кавычки числа UInt64.
Отключено по умолчанию.
input_format_csv_try_infer_strings_from_quoted_tuples
Интерпретировать заключенные в кавычки кортежи во входных данных как значение типа String.
input_format_csv_use_best_effort_in_schema_inference
Использовать некоторые уловки и эвристики для вывода схемы в формате CSV.
input_format_csv_use_default_on_bad_values
Разрешить установить значение по умолчанию для колонки, когда десериализация поля CSV завершилась неудачей из-за некорректного значения.
input_format_custom_allow_variable_number_of_columns
Игнорировать дополнительные колонки в формате ввода CustomSeparated (если файл имеет больше колонок, чем ожидалось) и считать отсутствующие поля в формате CustomSeparated значениями по умолчанию.
input_format_custom_detect_header
Автоматически обнаруживать заголовок с именами и типами в формате CustomSeparated.
input_format_custom_skip_trailing_empty_lines
Пропустить завершающие пустые строки в формате CustomSeparated.
input_format_defaults_for_omitted_fields
При выполнении запросов INSERT
заменять пропущенные значения входных колонок значениями по умолчанию соответствующих колонок. Эта опция применяется к JSONEachRow (и другим JSON форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native и форматам с суффиксами WithNames
/WithNamesAndTypes
.
Когда эта опция включена, расширенные метаданные таблицы отправляются с сервера на клиент. Это потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_force_null_for_omitted_fields
Принудительно инициализировать пропущенные поля значениями null.
input_format_hive_text_allow_variable_number_of_columns
Игнорировать дополнительные колонки в формате Hive Text (если файл имеет больше колонок, чем ожидалось) и считать отсутствующие поля в формате Hive Text значениями по умолчанию.
input_format_hive_text_collection_items_delimiter
Разделитель между элементами коллекции (массива или map) в формате Hive Text File.
input_format_hive_text_fields_delimiter
Разделитель между полями в формате Hive Text File.
input_format_hive_text_map_keys_delimiter
Разделитель между парой ключ/значение в формате Hive Text File.
input_format_import_nested_json
Включает или отключает вставку данных JSON с вложенными объектами.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Смотрите также:
- Использование вложенных структур с форматом
JSONEachRow
.
input_format_ipv4_default_on_conversion_error
Десериализация IPv4 будет использовать значения по умолчанию вместо вызова исключения при ошибке конвертации.
Отключено по умолчанию.
input_format_ipv6_default_on_conversion_error
Десериализация IPV6 будет использовать значения по умолчанию вместо вызова исключения при ошибке конвертации.
Отключено по умолчанию.
input_format_json_compact_allow_variable_number_of_columns
Разрешить переменное количество колонок в строках в форматах ввода JSONCompact/JSONCompactEachRow. Игнорировать дополнительные колонки в строках с большим количеством колонок, чем ожидалось, и считать отсутствующие колонки значениями по умолчанию.
Отключено по умолчанию.
input_format_json_defaults_for_missing_elements_in_named_tuple
Вставить значения по умолчанию для отсутствующих элементов в JSON объекте при парсинге именованного кортежа.
Эта настройка работает только при включенной настройке input_format_json_named_tuples_as_objects
.
Включено по умолчанию.
input_format_json_empty_as_default
При включении заменить пустые входные поля в JSON значениями по умолчанию. Для сложных выражений по умолчанию input_format_defaults_for_omitted_fields
также должно быть включено.
Возможные значения:
- 0 — Отключить.
- 1 — Включить.
input_format_json_ignore_unknown_keys_in_named_tuple
Игнорировать неизвестные ключи в JSON объекте для именованных кортежей.
Включено по умолчанию.
input_format_json_ignore_unnecessary_fields
Игнорировать ненужные поля и не парсить их. Включение этого может не вызывать исключения для строк JSON неверного формата или с дублированными полями.
input_format_json_infer_array_of_dynamic_from_array_of_different_types
Если включено, при выводе схемы ClickHouse будет использовать тип Array(Dynamic) для JSON массивов со значениями разных типов данных.
Пример:
Включено по умолчанию.
input_format_json_infer_incomplete_types_as_strings
Позволяет использовать тип String для JSON ключей, которые содержат только Null
/{}
/[]
в образце данных при выводе схемы.
В JSON форматах любое значение может быть прочитано как строка, и мы можем избежать ошибок, таких как Невозможно определить тип для колонки 'column_name' по первым 25000 строкам данных, скорее всего эта колонка содержит только Null или пустые массивы/maps
, при выводе схемы, используя строковый тип для ключей с неизвестными типами.
Пример:
Результат:
Включено по умолчанию.
input_format_json_map_as_array_of_tuples
Десериализовать колонки map как JSON массивы кортежей.
Отключено по умолчанию.
input_format_json_max_depth
Максимальная глубина поля в JSON. Это не строгий предел, он не обязательно должен применяться строго.
input_format_json_named_tuples_as_objects
Парсить колонки именованных кортежей как JSON объекты.
Включено по умолчанию.
input_format_json_read_arrays_as_strings
Разрешить парсинг JSON массивов как строк в форматах ввода JSON.
Пример:
Результат:
Включено по умолчанию.
input_format_json_read_bools_as_numbers
Разрешить парсинг булевых значений как чисел в форматах ввода JSON.
Включено по умолчанию.
input_format_json_read_bools_as_strings
Разрешить парсинг булевых значений как строк в форматах ввода JSON.
Включено по умолчанию.
input_format_json_read_numbers_as_strings
Разрешить парсинг чисел как строк в форматах ввода JSON.
Включено по умолчанию.
input_format_json_read_objects_as_strings
Разрешить парсинг JSON объектов как строк в форматах ввода JSON.
Пример:
Результат:
Включено по умолчанию.
input_format_json_throw_on_bad_escape_sequence
Сгенерировать исключение, если строка JSON содержит недопустимую последовательность экранирования в форматах ввода JSON. Если отключено, недопустимые последовательности экранирования останутся неизменными в данных.
Включено по умолчанию.
input_format_json_try_infer_named_tuples_from_objects
Если включено, при выводе схемы ClickHouse будет пытаться вывести именованный кортеж из JSON объектов. Результирующий именованный кортеж будет содержать все элементы из всех соответствующих JSON объектов из образца данных.
Пример:
Результат:
Включено по умолчанию.
input_format_json_try_infer_numbers_from_strings
Если включено, при выводе схемы ClickHouse будет пытаться вывести числа из строковых полей. Это может быть полезно, если данные JSON содержат заключенные в кавычки числа UInt64.
Отключено по умолчанию.
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
Использовать строковый тип вместо исключения в случае неоднозначных путей в JSON объектах при выводе именованных кортежей.
input_format_json_validate_types_from_metadata
Для форматов ввода JSON/JSONCompact/JSONColumnsWithMetadata, если эта настройка установлена в 1, типы из метаданных входных данных будут сравниваться с типами соответствующих колонок из таблицы.
Включено по умолчанию.
input_format_max_block_size_bytes
Ограничивает размер блоков, формируемых при парсинге данных в форматах ввода в байтах. Используется в форматах ввода, основанных на строках, когда блок формируется на стороне ClickHouse. 0 означает отсутствие ограничения в байтах.
input_format_max_bytes_to_read_for_schema_inference
Максимальное количество данных в байтах для автоматического вывода схемы.
input_format_max_rows_to_read_for_schema_inference
Максимальное количество строк данных для автоматического вывода схемы.
input_format_msgpack_number_of_columns
Количество колонок в вставленных данных MsgPack. Используется для автоматического вывода схемы из данных.
input_format_mysql_dump_map_column_names
Сопоставить колонки из таблицы в дампе MySQL и колонки из таблицы ClickHouse по именам.
input_format_mysql_dump_table_name
Имя таблицы в дампе MySQL, откуда считывать данные.
input_format_native_allow_types_conversion
Разрешить преобразование типов данных в формате ввода Native.
input_format_native_decode_types_in_binary_format
Читать типы данных в бинарном формате вместо имен типов в формате ввода Native.
input_format_null_as_default
Включает или отключает инициализацию полей NULL значениями по умолчанию, если тип данных этих полей не Nullable.
Если тип колонки не разрешает null, и эта настройка отключена, тогда вставка NULL
вызывает исключение. Если тип колонки допускает null, то значения NULL
вставляются как есть, независимо от этой настройки.
Эта настройка применима для большинства форматов ввода.
Для сложных выражений по умолчанию input_format_defaults_for_omitted_fields
также должно быть включено.
Возможные значения:
- 0 — Вставка
NULL
в ненулевую колонку вызывает исключение. - 1 — Поля
NULL
инициализируются значениями по умолчанию колонок.
input_format_orc_allow_missing_columns
Разрешить отсутствующие колонки при чтении форматов ввода ORC.
input_format_orc_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов ORC с столбцами CH.
input_format_orc_dictionary_as_low_cardinality
Обрабатывать закодированные словарем столбцы ORC как столбцы LowCardinality при чтении файлов ORC.
input_format_orc_filter_push_down
При чтении файлов ORC пропускать целые полосы или группы строк на основе выражений WHERE/PREWHERE, статистики min/max или фильтра Блума в метаданных ORC.
input_format_orc_reader_time_zone_name
Имя часового пояса для считывателя строк ORC, по умолчанию часовой пояс считывателя строк ORC GMT.
input_format_orc_row_batch_size
Размер пакета при чтении полос ORC.
input_format_orc_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при выводе схемы для формата ORC.
input_format_orc_use_fast_decoder
Использовать более быструю реализацию декодера ORC.
input_format_parquet_allow_geoparquet_parser
Использовать парсер геоколонок для преобразования Array(UInt8) в типы Point/Linestring/Polygon/MultiLineString/MultiPolygon.
input_format_parquet_allow_missing_columns
Разрешить отсутствие столбцов при чтении входных форматов Parquet.
input_format_parquet_bloom_filter_push_down
При чтении файлов Parquet пропускать целые группы строк на основе выражений WHERE и фильтра Блума в метаданных Parquet.
input_format_parquet_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов Parquet с столбцами CH.
input_format_parquet_enable_json_parsing
При чтении файлов Parquet парсить JSON-столбцы как JSON-столбцы ClickHouse.
input_format_parquet_enable_row_group_prefetch
Включить предзагрузку групп строк во время парсинга Parquet. В настоящее время только однопоточный парсинг может предзагружать.
input_format_parquet_filter_push_down
При чтении файлов Parquet пропускать целые группы строк на основе выражений WHERE/PREWHERE и статистики min/max в метаданных Parquet.
input_format_parquet_local_file_min_bytes_for_seek
Минимальное количество байт, необходимое для локального чтения (файла) для выполнения поиска, вместо чтения с игнорированием в формате входных данных Parquet.
input_format_parquet_max_block_size
Максимальный размер блока для считывателя Parquet.
input_format_parquet_memory_high_watermark
Приблизительный лимит памяти для считывателя Parquet v3. Ограничивает, сколько групп строк или столбцов можно прочитать параллельно. При чтении нескольких файлов в одном запросе, лимит касается общего использования памяти для этих файлов.
input_format_parquet_memory_low_watermark
Запланировать предзагрузки более агрессивно, если использование памяти ниже порога. Потенциально полезно, например, если нужно прочитать много небольших фильтров Блума по сети.
input_format_parquet_page_filter_push_down
Пропускать страницы, используя значения min/max из индексных столбцов.
input_format_parquet_prefer_block_bytes
Средний размер блока, выводимый считывателем Parquet.
input_format_parquet_preserve_order
Избегать переупорядочивания строк при чтении из файлов Parquet. Не рекомендуется, так как порядок строк обычно не гарантируется, и другие части конвейера запроса могут нарушить его. Используйте ORDER BY _row_number
вместо этого.
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при выводе схемы для формата Parquet.
input_format_parquet_use_native_reader
Использовать нативный считыватель Parquet v1. Он относительно быстрый, но незавершенный. Устарел.
input_format_parquet_use_native_reader_v3 {#input_format_parquet_use_native_reader_v3} Experimental feature. Learn more.
Использовать считыватель Parquet v3. Экспериментально.
input_format_parquet_use_offset_index
Незначительное изменение того, как страницы считываются из файла Parquet, когда фильтрация страниц не используется.
input_format_protobuf_flatten_google_wrappers
Включить обертки Google для обычных ненестированных столбцов, например, google.protobuf.StringValue 'str' для столбца String 'str'. Для Nullable столбцов пустые обертки распознаются как значения по умолчанию, а отсутствующие как null.
input_format_protobuf_oneof_presence
Указать, какое поле protobuf oneof было найдено, установив значение перечисления в специальный столбец.
input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference
Пропускать поля с неподдерживаемыми типами при выводе схемы для формата Protobuf.
input_format_record_errors_file_path
Путь к файлу, который используется для записи ошибок при чтении текстовых форматов (CSV, TSV).
input_format_skip_unknown_fields
Включает или отключает пропуск вставки дополнительных данных.
При записи данных ClickHouse выдает исключение, если входные данные содержат столбцы, которые отсутствуют в целевой таблице. Если пропуск включен, ClickHouse не вставляет дополнительные данные и не выдает исключение.
Поддерживаемые форматы:
- JSONEachRow (и другие форматы JSON)
- BSONEachRow (и другие форматы JSON)
- TSKV
- Все форматы с суффиксами WithNames/WithNamesAndTypes
- MySQLDump
- Native
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_try_infer_dates
Если включено, ClickHouse попытается вывести тип Date
из строковых полей при выводе схемы для текстовых форматов. Если все поля из столбца во входных данных были успешно распознаны как даты, то результирующий тип будет Date
, если хотя бы одно поле не было распознано как дата, то результирующий тип будет String
.
Включено по умолчанию.
input_format_try_infer_datetimes
Если включено, ClickHouse попытается вывести тип DateTime64
из строковых полей при выводе схемы для текстовых форматов. Если все поля из столбца во входных данных были успешно распознаны как даты и времени, то результирующий тип будет DateTime64
, если хотя бы одно поле не было распознано как дата и время, то результирующий тип будет String
.
Включено по умолчанию.
input_format_try_infer_datetimes_only_datetime64
Когда input_format_try_infer_datetimes включен, выводить только DateTime64, но не типы DateTime.
input_format_try_infer_exponent_floats
Пытаться выводить дробные числа в экспоненциальной нотации при выводе схемы в текстовых форматах (кроме JSON, где экспоненциальные числа всегда выводятся).
input_format_try_infer_integers
Если включено, ClickHouse попытается вывести целые числа вместо дробных при выводе схемы для текстовых форматов. Если все числа в столбце во входных данных целые, то результирующий тип будет Int64
, если хотя бы одно число дробное, то результирующий тип будет Float64
.
Включено по умолчанию.
input_format_try_infer_variants
Если включено, ClickHouse попытается вывести тип Variant
при выводе схемы для текстовых форматов, когда существует более одного возможного типа для элементов столбца/массива.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_tsv_allow_variable_number_of_columns
Игнорировать дополнительные столбцы в входном формате TSV (если файл имеет больше столбцов, чем ожидалось) и рассматривать отсутствующие поля во входном формате TSV как значения по умолчанию.
input_format_tsv_crlf_end_of_line
Если это значение установлено в true, функция файла будет читать формат TSV с \r\n вместо \n.
input_format_tsv_detect_header
Автоматически обнаруживать заголовок с именами и типами в формате TSV.
input_format_tsv_empty_as_default
Рассматривать пустые поля во входном формате TSV как значения по умолчанию.
input_format_tsv_enum_as_number
Обрабатывать вставляемые значения перечисления в форматах TSV как индексы перечисления.
input_format_tsv_skip_first_lines
Пропускать указанное количество строк в начале данных в формате TSV.
input_format_tsv_skip_trailing_empty_lines
Пропускать завершающие пустые строки в формате TSV.
input_format_tsv_use_best_effort_in_schema_inference
Использовать некоторые настройки и эвристики для вывода схемы в формате TSV.
input_format_values_accurate_types_of_literals
Для формата Values: при парсинге и интерпретации выражений, используя шаблон, проверять фактический тип литерала, чтобы избежать возможных переполнений и проблем с точностью.
input_format_values_deduce_templates_of_expressions
Для формата Values: если поле не удалось распознать с помощью потокового парсера, запустить SQL-парсер, вывести шаблон SQL-выражения, попытаться распознать все строки с использованием шаблона, а затем интерпретировать выражение для всех строк.
input_format_values_interpret_expressions
Для формата Values: если поле не удалось распознать с помощью потокового парсера, запустить SQL-парсер и попытаться интерпретировать его как SQL-выражение.
input_format_with_names_use_header
Включает или отключает проверку порядка столбцов при вставке данных.
Для улучшения производительности вставки мы рекомендуем отключить эту проверку, если вы уверены, что порядок столбцов входных данных совпадает с порядком в целевой таблице.
Поддерживаемые форматы:
- CSVWithNames
- CSVWithNamesAndTypes
- TabSeparatedWithNames
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNames
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNames
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNames
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNames
- CustomSeparatedWithNamesAndTypes
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_with_types_use_header
Контролирует, должен ли парсер формата проверять, соответствуют ли типы данных из входных данных типам данных из целевой таблицы.
Поддерживаемые форматы:
- CSVWithNamesAndTypes
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNamesAndTypes
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
insert_distributed_one_random_shard
Включает или отключает случайную вставку в шард в таблицу Distributed, когда отсутствует распределенный ключ.
По умолчанию, при вставке данных в таблицу Distributed
с более чем одним шардом, сервер ClickHouse отклоняет любой запрос на вставку, если не задан распределенный ключ. Когда insert_distributed_one_random_shard = 1
, вставки разрешены и данные передаются случайным образом между всеми шардом.
Возможные значения:
- 0 — Вставка отклоняется, если имеется несколько шардов и не указан распределенный ключ.
- 1 — Вставка производится случайным образом среди всех доступных шардов, когда не указан распределенный ключ.
interval_output_format
Разрешает выбирать различные форматы вывода текстового представления типов интервалов.
Возможные значения:
-
kusto
- выходной формат в стиле KQL.ClickHouse выводит интервалы в формате KQL. Например,
toIntervalDay(2)
будет отформатирован как2.00:00:00
. Обратите внимание, что для типов интервалов переменной длины (т.е.IntervalMonth
иIntervalYear
) учитывается среднее количество секунд на интервал. -
numeric
- числовой выходной формат.ClickHouse выводит интервалы как их базовое числовое представление. Например,
toIntervalDay(2)
будет отформатирован как2
.
См. также:
json_type_escape_dots_in_keys
Когда включено, точки в ключах JSON будут экранированы во время парсинга.
output_format_arrow_compression_method
Метод сжатия для формата вывода Arrow. Поддерживаемые кодеки: lz4_frame, zstd, none (несжатый).
output_format_arrow_fixed_string_as_fixed_byte_array
Использовать тип Arrow FIXED_SIZE_BINARY вместо Binary для столбцов FixedString.
output_format_arrow_low_cardinality_as_dictionary
Включить вывод типа LowCardinality в качестве типа словаря Arrow.
output_format_arrow_string_as_string
Использовать тип Arrow String вместо Binary для столбцов String.
output_format_arrow_use_64_bit_indexes_for_dictionary
Всегда использовать 64-битные целые числа для индексов словарей в формате Arrow.
output_format_arrow_use_signed_indexes_for_dictionary
Использовать знаковые целые числа для индексов словарей в формате Arrow.
output_format_avro_codec
Кодек сжатия, используемый для вывода. Возможные значения: 'null', 'deflate', 'snappy', 'zstd'.
output_format_avro_rows_in_file
Максимальное количество строк в файле (если разрешено хранилищем).
output_format_avro_string_column_pattern
Для формата Avro: регулярное выражение для выборки строковых столбцов в качестве AVRO строк.
output_format_avro_sync_interval
Интервал синхронизации в байтах.
output_format_binary_encode_types_in_binary_format
Записывать типы данных в двоичном формате вместо имен типов в формате RowBinaryWithNamesAndTypes.
output_format_binary_write_json_as_string
Записывать значения типа JSON в формате строк String в формате RowBinary.
output_format_bson_string_as_string
Использовать тип BSON String вместо Binary для столбцов String.
output_format_csv_crlf_end_of_line
Если это значение установлено в true, конец строки в формате CSV будет \r\n вместо \n.
output_format_csv_serialize_tuple_into_separate_columns
Если это значение установлено в true, то кортежи в формате CSV сериализуются как отдельные столбцы (то есть их вложенность в кортеже теряется).
output_format_decimal_trailing_zeros
Выводить конечные нули при печати значений Decimal. Например, 1.230000 вместо 1.23.
Отключено по умолчанию.
output_format_json_array_of_rows
Включает возможность вывода всех строк в виде JSON массива в формате JSONEachRow.
Возможные значения:
- 1 — ClickHouse выводит все строки как массив, каждая строка в формате
JSONEachRow
. - 0 — ClickHouse выводит каждую строку отдельно в формате
JSONEachRow
.
Пример запроса с включенной настройкой
Запрос:
Результат:
Пример запроса с отключенной настройкой
Запрос:
Результат:
output_format_json_escape_forward_slashes
Контролирует экранирование прямых слэшей при выводе строк в формате JSON. Это предназначено для совместимости с JavaScript. Не путать со слэшами, которые всегда экранируются.
Включено по умолчанию.
output_format_json_map_as_array_of_tuples
Сериализовать столбцы карты как JSON массивы кортежей.
Отключено по умолчанию.
output_format_json_named_tuples_as_objects
Сериализовать столбцы именованных кортежей как JSON объекты.
Включено по умолчанию.
output_format_json_pretty_print
Эта настройка определяет, как отображаются вложенные структуры, такие как кортежи, карты и массивы, внутри массива data
при использовании формата вывода JSON.
Например, вместо вывода:
Вывод будет отформатирован как:
Включено по умолчанию.
output_format_json_quote_64bit_floats
Контролирует экранирование 64-битных чисел с плавающей запятой при выводе в формате JSON.
Отключено по умолчанию.
output_format_json_quote_64bit_integers
Контролирует экранирование 64-битных или больших целых чисел (например, UInt64
или Int128
) при выводе в формате JSON.
Такие целые числа по умолчанию заключаются в кавычки. Это поведение совместимо с большинством реализаций JavaScript.
Возможные значения:
- 0 — Целые числа выводятся без кавычек.
- 1 — Целые числа заключаются в кавычки.
output_format_json_quote_decimals
Контролирует экранирование десятичных значений в форматах вывода JSON.
Отключено по умолчанию.
output_format_json_quote_denormals
Включает выводы +nan
, -nan
, +inf
, -inf
в формате JSON.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
Пример
Рассмотрим следующую таблицу account_orders
:
Когда output_format_json_quote_denormals = 0
, запрос возвращает значения null
в выводе:
Когда output_format_json_quote_denormals = 1
, запрос возвращает:
output_format_json_skip_null_value_in_named_tuples
Пропускать пары ключ-значение с нулевым значением при сериализации столбцов именованных кортежей как JSON объекты. Это имеет смысл только тогда, когда output_format_json_named_tuples_as_objects равно true.
output_format_json_validate_utf8
Контролирует проверку последовательностей UTF-8 в форматах вывода JSON, не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata, они всегда проверяют UTF-8.
Отключено по умолчанию.
output_format_markdown_escape_special_characters
Когда включено, экранировать специальные символы в Markdown.
Common Mark определяет следующие специальные символы, которые могут быть экранированы с помощью :
Возможные значения:
- 0 — Отключить.
- 1 — Включить.
output_format_msgpack_uuid_representation
Способ вывода UUID в формате MsgPack.
output_format_native_encode_types_in_binary_format
Записывать типы данных в двоичном формате вместо имен типов в нативном формате.
output_format_native_use_flattened_dynamic_and_json_serialization
Записывать данные из столбцов JSON и Dynamic в упрощенном формате (все типы/пути как отдельные подстолбцы).
output_format_native_write_json_as_string
Записывать данные из столбца JSON как столбец String, содержащий JSON строки вместо стандартной нативной сериализации JSON.
output_format_orc_compression_block_size
Размер блока сжатия в байтах для формата вывода ORC.
output_format_orc_compression_method
Метод сжатия для формата вывода ORC. Поддерживаемые кодеки: lz4, snappy, zlib, zstd, none (несжатый).
output_format_orc_dictionary_key_size_threshold
Для строкового столбца в формате вывода ORC, если число уникальных значений превышает эту долю от общего числа ненулевых строк, отключить кодирование словаря. В противном случае кодирование словаря включается.
output_format_orc_row_index_stride
Целевая ширина индекса строк в формате вывода ORC.
output_format_orc_string_as_string
Использовать тип ORC String вместо Binary для столбцов String.
output_format_orc_writer_time_zone_name
Имя часового пояса для писателя ORC, по умолчанию часовой пояс писателя ORC GMT.
output_format_parquet_batch_size
Проверяйте размер страницы после каждого указанного количества строк. Рассмотрите возможность уменьшения, если у вас есть столбцы со средним размером значений выше нескольких КБ.
output_format_parquet_bloom_filter_bits_per_value
Приблизительное количество бит, используемых для каждого уникального значения в фильтрах Блума Parquet. Оценочные показатели ложных срабатываний:
- 6 бит - 10%
- 10.5 бит - 1%
- 16.9 бит - 0.1%
- 26.4 бит - 0.01%
- 41 бит - 0.001%
output_format_parquet_bloom_filter_flush_threshold_bytes
Где в файле Parquet разместить фильтры Блума. Фильтры Блума будут записываться группами приблизительно такого размера. В частности:
- если 0, фильтры Блума каждой группы строк записываются сразу после группы строк,
- если больше, чем общий размер всех фильтров Блума, фильтры Блума для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
- иначе, фильтры Блума будут накапливаться в памяти и записываться в момент, когда их общий размер превысит это значение.
output_format_parquet_compliant_nested_types
В схеме файла Parquet использовать имя 'element' вместо 'item' для элементов списка. Это исторический артефакт реализации библиотеки Arrow. В целом повышает совместимость, за исключением, возможно, некоторых старых версий Arrow.
output_format_parquet_compression_method
Метод сжатия для формата вывода Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (несжатый).
output_format_parquet_data_page_size
Целевой размер страницы в байтах до сжатия.
output_format_parquet_date_as_uint16
Записывать значения Даты как простые 16-битные числа (читать обратно как UInt16), вместо преобразования в 32-битный тип даты Parquet (читать обратно как Date32).
output_format_parquet_datetime_as_uint32
Записывать значения DateTime как сырой временной штамп Unix (читать назад как UInt32), вместо преобразования в миллисекунды (читать назад как DateTime64(3)).
output_format_parquet_enum_as_byte_array
Записывать перечисление, используя физический тип Parquet: BYTE_ARRAY и логический тип: ENUM.
output_format_parquet_fixed_string_as_fixed_byte_array
Использовать тип Parquet FIXED_LENGTH_BYTE_ARRAY вместо Binary для столбцов FixedString.
output_format_parquet_geometadata
Разрешить записывать информацию о геоколонках в метаданные parquest и кодировать столбцы в формате WKB.
output_format_parquet_max_dictionary_size
Если размер словаря становится больше этого количества байт, переключиться на кодирование без словаря. Установите в 0, чтобы отключить кодирование словаря.
output_format_parquet_parallel_encoding
Выполнять кодирование Parquet в нескольких потоках. Требуется output_format_parquet_use_custom_encoder.
output_format_parquet_row_group_size
Целевой размер группы строк в строках.
output_format_parquet_row_group_size_bytes
Целевой размер группы строк в байтах до сжатия.
output_format_parquet_string_as_string
Использовать тип Parquet String вместо Binary для столбцов String.
output_format_parquet_use_custom_encoder
Использовать более быструю реализацию кодировщика Parquet.
output_format_parquet_version
Версия формата Parquet для формата вывода. Поддерживаемые версии: 1.0, 2.4, 2.6 и 2.последняя (по умолчанию).
output_format_parquet_write_bloom_filter
Записывать фильтры Блума в файлы Parquet. Требует output_format_parquet_use_custom_encoder = true.
output_format_parquet_write_page_index
Записывать индекс столбца и индекс смещения (т.е. статистику о каждой странице данных, которая может быть использована для фильтрации при чтении) в файлы Parquet.
output_format_pretty_color
Использовать ANSI-escape последовательности в красивых форматах. 0 - отключено, 1 - включено, 'auto' - включено, если терминал.
output_format_pretty_display_footer_column_names
Отображать имена столбцов в нижнем колонтитуле, если имеется много строк таблицы.
Возможные значения:
- 0 — Имена столбцов не отображаются в нижнем колонтитуле.
- 1 — Имена столбцов отображаются в нижнем колонтитуле, если количество строк больше или равно пороговому значению, установленному output_format_pretty_display_footer_column_names_min_rows (по умолчанию 50).
Пример
Запрос:
Результат:
output_format_pretty_display_footer_column_names_min_rows
Устанавливает минимальное количество строк, для которого будет отображаться подвал с именами колонок, если включена настройка output_format_pretty_display_footer_column_names.
output_format_pretty_fallback_to_vertical
Если включено, и таблица широкая, но короткая, то формат Pretty будет выводиться так же, как вертикальный формат.
Смотрите output_format_pretty_fallback_to_vertical_max_rows_per_chunk
и output_format_pretty_fallback_to_vertical_min_table_width
для детальной настройки этого поведения.
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
Падение на вертикальный формат (см. output_format_pretty_fallback_to_vertical
) будет активировано только если количество записей в фрагменте не больше указанного значения.
output_format_pretty_fallback_to_vertical_min_columns
Падение на вертикальный формат (см. output_format_pretty_fallback_to_vertical
) будет активировано только если количество колонок больше заданного значения.
output_format_pretty_fallback_to_vertical_min_table_width
Падение на вертикальный формат (см. output_format_pretty_fallback_to_vertical
) будет активировано только если сумма длин колонок в таблице не менее указанного значения, или если хотя бы одно значение содержит символ новой строки.
output_format_pretty_glue_chunks
Если данные, отображаемые в форматах Pretty, пришли в нескольких фрагментах, даже с задержкой, но следующий фрагмент имеет такие же ширины колонок, как предыдущий, используйте ANSI escape последовательности для возврата к предыдущей строке и перезаписи подвала предыдущего фрагмента, чтобы продолжить с данными нового фрагмента. Это делает результат более визуально приятным.
0 - отключено, 1 - включено, 'auto' - включено, если это терминал.
output_format_pretty_grid_charset
Кодировка для печати границ сетки. Доступные кодировки: ASCII, UTF-8 (по умолчанию).
output_format_pretty_highlight_digit_groups
Если включено и вывод осуществляется в терминал, выделяйте каждую цифру, соответствующую числу тысяч, миллионов и т. д., подчеркиванием.
output_format_pretty_highlight_trailing_spaces
Если включено и вывод осуществляется в терминал, выделяйте пробелы в конце строк серым цветом и подчеркиванием.
output_format_pretty_max_column_name_width_cut_to
Если имя колонки слишком длинное, обрежьте его до этой длины.
Колонка будет обрезана, если она длиннее output_format_pretty_max_column_name_width_cut_to
плюс output_format_pretty_max_column_name_width_min_chars_to_cut
.
output_format_pretty_max_column_name_width_min_chars_to_cut
Минимальное количество символов для обрезания, если имя колонки слишком длинное.
Колонка будет обрезана, если она длиннее output_format_pretty_max_column_name_width_cut_to
плюс output_format_pretty_max_column_name_width_min_chars_to_cut
.
output_format_pretty_max_column_pad_width
Максимальная ширина для заполнения всех значений в колонке в форматах Pretty.
output_format_pretty_max_rows
Лимит строк для форматов Pretty.
output_format_pretty_max_value_width
Максимальная ширина значения, отображаемого в форматах Pretty. Если больше - будет обрезано. Значение 0 означает - никогда не обрезать.
output_format_pretty_max_value_width_apply_for_single_value
Обрежьте значения (см. настройку output_format_pretty_max_value_width
) только тогда, когда это не единственное значение в блоке. В противном случае выводите полностью, что полезно для запроса SHOW CREATE TABLE
.
output_format_pretty_multiline_fields
Если включено, форматы Pretty будут отображать многострочные поля внутри ячейки таблицы, поэтому контур таблицы будет сохранен. Если нет, они будут отображаться как есть, что может деформировать таблицу (одним из преимуществ отключения является то, что копирование и вставка многострочных значений будет проще).
output_format_pretty_row_numbers
Добавьте номера строк перед каждой строкой для формата вывода pretty.
output_format_pretty_single_large_number_tip_threshold
Распечатайте понятное число рядом с таблицей, если блок состоит из единственного числа, которое превышает это значение (кроме 0).
output_format_pretty_squash_consecutive_ms
Ожидайте следующий блок до указанного числа миллисекунд и объединяйте его с предыдущим перед записью. Это позволяет избежать частого вывода слишком маленьких блоков, но все же позволяет отображать данные в потоковом режиме.
output_format_pretty_squash_max_wait_ms
Выводите ожидающий блок в форматах pretty, если прошло более указанного числа миллисекунд с момента предыдущего вывода.
output_format_protobuf_nullables_with_google_wrappers
При сериализации Nullable колонок с обертками Google сериализуйте значения по умолчанию как пустые обертки. Если отключено, значения по умолчанию и null не сериализуются.
output_format_schema
Путь к файлу, где будет сохранена автоматически сгенерированная схема в форматах Cap'n Proto или Protobuf.
output_format_sql_insert_include_column_names
Включить имена колонок в запросе INSERT.
output_format_sql_insert_max_batch_size
Максимальное количество строк в одном операторе INSERT.
output_format_sql_insert_quote_names
Цитировать имена колонок с символами '`'.
output_format_sql_insert_table_name
Имя таблицы в выходном запросе INSERT.
output_format_sql_insert_use_replace
Использовать оператор REPLACE вместо INSERT.
output_format_tsv_crlf_end_of_line
Если установлено в true, конец строки в формате TSV будет \r\n вместо \n.
output_format_values_escape_quote_with_quote
Если true, экранировать ' с '', в противном случае заключать в \'
output_format_write_statistics
Записывать статистику о прочитанных строках, байтах, времени выполнения в подходящих форматах вывода.
Включено по умолчанию.
precise_float_parsing
Предпочитать более точный (но медленный) алгоритм разбора float.
regexp_dict_allow_hyperscan
Разрешить словарь regexp_tree с использованием библиотеки Hyperscan.
regexp_dict_flag_case_insensitive
Использовать нечувствительное к регистру сопоставление для словаря regexp_tree. Может быть переопределено в отдельных выражениях с помощью (?i) и (?-i).
regexp_dict_flag_dotall
Разрешить '.' соответствовать символам новой строки для словаря regexp_tree.
rows_before_aggregation
При включении ClickHouse будет предоставлять точное значение для статистики rows_before_aggregation, представляющей количество строк, прочитанных до агрегации.
schema_inference_hints
Список имен колонок и типов для использования в качестве подсказок в выводе схемы для форматов без схемы.
Пример:
Запрос:
Результат:
Если schema_inference_hints
не отформатирован должным образом, или если есть опечатка или неправильный тип данных и т. д., вся подсказка schema_inference_hints будет проигнорирована.
schema_inference_make_columns_nullable
Управляет преобразованием выведенных типов в Nullable
в выводе схемы.
Возможные значения:
- 0 - выведенный тип никогда не будет
Nullable
(используйте input_format_null_as_default для управления тем, что делать с null значениями в этом случае), - 1 - все выведенные типы будут
Nullable
, - 2 или
auto
- выведенный тип будетNullable
только если колонка содержитNULL
в выборке, которая разбирается во время вывода схемы, или метаданные файла содержат информацию о допустимости null для колонки, - 3 - допустимость null для выведенного типа будет соответствовать метаданным файла, если формат это имеет (например, Parquet), иначе всегда Nullable (например, CSV).
schema_inference_make_json_columns_nullable
Управляет преобразованием выведенных типов JSON в Nullable
в выводе схемы.
Если эта настройка включена вместе с schema_inference_make_columns_nullable, выведенный тип JSON будет Nullable
.
schema_inference_mode
Режим вывода схемы. 'default' - предполагается, что все файлы имеют одинаковую схему и схема может быть выведена из любого файла, 'union' - файлы могут иметь разные схемы, и результирующая схема должна быть объединением схем всех файлов.
show_create_query_identifier_quoting_rule
Установите правило цитирования для идентификаторов в запросе SHOW CREATE.
show_create_query_identifier_quoting_style
Установите стиль цитирования для идентификаторов в запросе SHOW CREATE.
type_json_skip_duplicated_paths
Если включено, при разборе JSON объекта в тип JSON дублирующиеся пути будут игнорироваться, и только первый путь будет вставлен вместо исключения.
validate_experimental_and_suspicious_types_inside_nested_types
Проверять использование экспериментальных и подозрительных типов внутри вложенных типов, таких как Array/Map/Tuple