Перейти к основному содержимому
Перейти к основному содержимому

Учебные пособия и примерные наборы данных

У нас есть множество ресурсов, которые помогут вам начать работу и изучить, как работает ClickHouse:

Кроме того, примерные наборы данных обеспечивают отличный опыт работы с ClickHouse, изучения важных техник и уловок, а также демонстрируют, как aprovechar многие мощные функции ClickHouse. Примерные наборы данных включают:

СтраницаОписание
Глобальная историческая климатологическая сеть NOAA2.5 миллиарда строк климатических данных за последние 120 лет
Написание запросов в ClickHouse с использованием данных GitHubНабор данных, содержащий все коммиты и изменения для репозитория ClickHouse
Анализ данных Stack Overflow с помощью ClickHouseАнализ данных Stack Overflow с помощью ClickHouse
Набор данных о ценах на недвижимость в ВеликобританииУзнайте, как использовать проекции для повышения производительности часто выполняемых запросов, используя набор данных о ценах на недвижимость в Великобритании, который содержит данные о ценах, уплаченных за недвижимость в Англии и Уэльсе
Исторические метеорологические данные Тайваня131 миллион строк данных наблюдений за погодой за последние 128 лет
Данные такси Нью-ЙоркаДанные о миллиардах поездок на такси и арендуемых транспортных средств (Uber, Lyft и др.), начинающихся в Нью-Йорке с 2009 года
Геоданные с использованием набора данных о вышках сотовой связиУзнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель мониторинга на основе данных
Отзывы клиентов AmazonБолее 150 миллионов отзывов клиентов о продуктах Amazon
Оценка больших данных AMPLabНабор данных для оценки производительности решений хранилищ данных.
Анонимизированная веб-аналитикаНабор данных, состоящий из двух таблиц, содержащих анонимизированные данные веб-аналитики с показами и посещениями
Бенчмарк Брауновского университетаНовый аналитический бенчмарк для данных логов, сгенерированных машиной
Открытые данные COVID-19Открытые данные COVID-19 — это крупная база данных открытых источников эпидемиологических данных COVID-19 и связанных факторов, таких как демография, экономика и реакции правительства
Набор данных dbpediaНабор данных, содержащий 1 миллион статей из Википедии и их векторные эмбеддинги
Данные с сенсоров окружающей средыБолее 20 миллиардов записей данных от Sensor.Community, глобальной сети сенсоров, создающей открытые экологические данные.
Места FoursquareНабор данных с более чем 100 миллионами записей, содержащих информацию о местах на карте, таких как магазины, рестораны, парки, игровые площадки и памятники.
Набор данных событий GitHubНабор данных, содержащий все события на GitHub с 2011 года по 6 декабря 2020 года, размером 3.1 миллиарда записей.
Набор данных Hacker NewsНабор данных, содержащий 28 миллионов строк данных Hacker News.
Набор данных векторного поиска Hacker NewsНабор данных, содержащий более 28 миллионов публикаций Hacker News и их векторные эмбеддинги
Набор данных LAION 5BНабор данных, содержащий 100 миллионов векторов из набора данных LAION 5B
Набор данных Laion-400MНабор данных, содержащий 400 миллионов изображений с английскими подписями к изображениям
Набор данных "Что в меню?" Библиотеки Нью-ЙоркаНабор данных, содержащий 1.3 миллиона записей исторических данных о меню отелей, ресторанов и кафе с блюдами и их ценами.
Данные о жалобах NYPDЗагрузка и запрос данных, разделенных табуляцией, в 5 этапов
OnTimeНабор данных, содержащий информацию о своевременности выполнения рейсов авиакомпаний
Бенчмарк звёздной схемы (SSB, 2009)Набор данных и запросы бенчмарка звёздной схемы (SSB)
Терабайт логов кликов от CriteoТерабайт логов кликов от Criteo
TPC-DS (2012)Набор данных и запросы бенчмарка TPC-DS.
TPC-H (1999)Набор данных и запросы бенчмарка TPC-H.
WikiStatИзучите набор данных WikiStat, содержащий 0.5 триллиона записей.
Набор данных YouTube о "дизлайках"Коллекция дизлайков к видео YouTube.