Учебные пособия и примерные наборы данных
У нас есть множество ресурсов, которые помогут вам начать работу и изучить, как работает ClickHouse:
- Если вам нужно установить ClickHouse и запустить его, ознакомьтесь с нашим Быстрым стартом
- Учебник по ClickHouse анализирует набор данных о поездках такси в Нью-Йорке
Кроме того, примерные наборы данных обеспечивают отличный опыт работы с ClickHouse, изучения важных техник и уловок, а также демонстрируют, как aprovechar многие мощные функции ClickHouse. Примерные наборы данных включают:
Страница | Описание |
---|---|
Глобальная историческая климатологическая сеть NOAA | 2.5 миллиарда строк климатических данных за последние 120 лет |
Написание запросов в ClickHouse с использованием данных GitHub | Набор данных, содержащий все коммиты и изменения для репозитория ClickHouse |
Анализ данных Stack Overflow с помощью ClickHouse | Анализ данных Stack Overflow с помощью ClickHouse |
Набор данных о ценах на недвижимость в Великобритании | Узнайте, как использовать проекции для повышения производительности часто выполняемых запросов, используя набор данных о ценах на недвижимость в Великобритании, который содержит данные о ценах, уплаченных за недвижимость в Англии и Уэльсе |
Исторические метеорологические данные Тайваня | 131 миллион строк данных наблюдений за погодой за последние 128 лет |
Данные такси Нью-Йорка | Данные о миллиардах поездок на такси и арендуемых транспортных средств (Uber, Lyft и др.), начинающихся в Нью-Йорке с 2009 года |
Геоданные с использованием набора данных о вышках сотовой связи | Узнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель мониторинга на основе данных |
Отзывы клиентов Amazon | Более 150 миллионов отзывов клиентов о продуктах Amazon |
Оценка больших данных AMPLab | Набор данных для оценки производительности решений хранилищ данных. |
Анонимизированная веб-аналитика | Набор данных, состоящий из двух таблиц, содержащих анонимизированные данные веб-аналитики с показами и посещениями |
Бенчмарк Брауновского университета | Новый аналитический бенчмарк для данных логов, сгенерированных машиной |
Открытые данные COVID-19 | Открытые данные COVID-19 — это крупная база данных открытых источников эпидемиологических данных COVID-19 и связанных факторов, таких как демография, экономика и реакции правительства |
Набор данных dbpedia | Набор данных, содержащий 1 миллион статей из Википедии и их векторные эмбеддинги |
Данные с сенсоров окружающей среды | Более 20 миллиардов записей данных от Sensor.Community, глобальной сети сенсоров, создающей открытые экологические данные. |
Места Foursquare | Набор данных с более чем 100 миллионами записей, содержащих информацию о местах на карте, таких как магазины, рестораны, парки, игровые площадки и памятники. |
Набор данных событий GitHub | Набор данных, содержащий все события на GitHub с 2011 года по 6 декабря 2020 года, размером 3.1 миллиарда записей. |
Набор данных Hacker News | Набор данных, содержащий 28 миллионов строк данных Hacker News. |
Набор данных векторного поиска Hacker News | Набор данных, содержащий более 28 миллионов публикаций Hacker News и их векторные эмбеддинги |
Набор данных LAION 5B | Набор данных, содержащий 100 миллионов векторов из набора данных LAION 5B |
Набор данных Laion-400M | Набор данных, содержащий 400 миллионов изображений с английскими подписями к изображениям |
Набор данных "Что в меню?" Библиотеки Нью-Йорка | Набор данных, содержащий 1.3 миллиона записей исторических данных о меню отелей, ресторанов и кафе с блюдами и их ценами. |
Данные о жалобах NYPD | Загрузка и запрос данных, разделенных табуляцией, в 5 этапов |
OnTime | Набор данных, содержащий информацию о своевременности выполнения рейсов авиакомпаний |
Бенчмарк звёздной схемы (SSB, 2009) | Набор данных и запросы бенчмарка звёздной схемы (SSB) |
Терабайт логов кликов от Criteo | Терабайт логов кликов от Criteo |
TPC-DS (2012) | Набор данных и запросы бенчмарка TPC-DS. |
TPC-H (1999) | Набор данных и запросы бенчмарка TPC-H. |
WikiStat | Изучите набор данных WikiStat, содержащий 0.5 триллиона записей. |
Набор данных YouTube о "дизлайках" | Коллекция дизлайков к видео YouTube. |