Исторические метеоданные Тайваня
Этот набор данных содержит исторические метеорологические наблюдения за последние 128 лет. Каждая строка представляет собой измерение для определенного момента времени и метеорологической станции.
Происхождение этого набора данных доступно здесь, а список номеров метеорологических станций можно найти здесь.
Источниками метеорологических наборов данных являются метеорологические станции, созданные Центральным метеорологическим управлением (код станции начинается с C0, C1 и 4), и сельскохозяйственные метеорологические станции, принадлежащие Совету сельского хозяйства (код станции отличается от указанных выше):
- StationId
- MeasuredDate, время наблюдения
- StnPres, атмосферное давление на станции
- SeaPres, атмосферное давление на уровне моря
- Td, температура точки росы
- RH, относительная влажность
- Другие элементы, где это возможно
Скачивание данных
- Предобработанная версия данных для ClickHouse, которая была очищена, переструктурирована и дополнена. Этот набор данных охватывает годы с 1896 по 2023.
- Скачайте оригинальные необработанные данные и преобразуйте в формат, необходимый для ClickHouse. Пользователи, желающие добавить свои собственные колонки, могут рассмотреть или завершить свои подходы.
Предобработанные данные
Данные также были переструктурированы с одного измерения на строку до одной строки на идентификатор метеорологической станции и измеренную дату, т.е.
Запрашивать такие данные легко, и в результате таблица имеет меньше пропусков, а некоторые элементы могут быть null, потому что их невозможно измерить на этой метеорологической станции.
Этот набор данных доступен по следующему адресу Google CloudStorage. Вы можете либо скачать набор данных на локальную файловую систему (и вставить их с помощью клиента ClickHouse), либо вставить их непосредственно в ClickHouse (см. Вставка по URL).
Чтобы скачать:
Оригинальные необработанные данные
Следующие детали касаются шагов для загрузки оригинальных необработанных данных, чтобы преобразовать и конвертировать их по своему усмотрению.
Загрузка
Для загрузки оригинальных необработанных данных:
Получение метеорологических станций Тайваня
Создание схемы таблицы
Создайте таблицу MergeTree в ClickHouse (с помощью клиента ClickHouse).
Вставка в ClickHouse
Вставка из локального файла
Данные можно вставить из локального файла следующим образом (с помощью клиента ClickHouse):
где /path/to
представляет собой конкретный путь пользователя к локальному файлу на диске.
И пример ответа после вставки данных в ClickHouse:
Вставка по URL
Чтобы узнать, как ускорить этот процесс, пожалуйста, ознакомьтесь с нашей статьей в блоге о оптимизации больших загрузок данных.
Проверка строк данных и размеров
- Давайте посмотрим, сколько строк было вставлено:
- Давайте посмотрим, сколько дискового пространства используется для этой таблицы:
Примеры запросов
Q1: Получить самую высокую температуру точки росы для каждой метеорологической станции в каждом конкретном году
Q2: Получение необработанных данных с определенным диапазоном времени, полями и метеорологической станцией
Благодарности
Мы хотим поблагодарить Центральное метеорологическое управление и Сеть сельскохозяйственных метеорологических наблюдений (станции) Совета сельского хозяйства за подготовку, очистку и распределение этого набора данных. Мы ценим ваши усилия.
Ou, J.-H., Kuo, C.-H., Wu, Y.-F., Lin, G.-C., Lee, M.-H., Chen, R.-K., Chou, H.-P., Wu, H.-Y., Chu, S.-C., Lai, Q.-J., Tsai, Y.-C., Lin, C.-C., Kuo, C.-C., Liao, C.-T., Chen, Y.-N., Chu, Y.-W., Chen, C.-Y., 2023. Модель глубокого обучения, ориентированная на приложение, для раннего предупреждения о грибковом заболевании риса на Тайване. Ecological Informatics 73, 101950. https://doi.org/10.1016/j.ecoinf.2022.101950 [13/12/2022]