Вход/Регистрация
UA RU
UA RU
  • UA
  • RU
  • Новости
  • Front-end
  • Back-end
  • Блокчейн
  • Учебник по Rust
  • Mobile app
  • Книги
  • Подборки
  • Истории
  • Решения
  • Теория
  • Железо
  • Интервью
  • Спецпроекты
  • Реклама в издании
  • Редакционные правила
  • Наша редакция
  • Об издании
  • Контакты
  • Рейтинг блогеров Highload

Присоединяйтесь к нам

  • UA
  • RU
  • Новости
  • Front-end
  • Back-end
  • Блокчейн
  • Учебник по Rust
  • Mobile app
  • Книги
  • Подборки
  • Истории
  • Решения
  • Теория
  • Железо
  • Интервью
  • Спецпроекты
  • Реклама в издании
  • Редакционные правила
  • Наша редакция
  • Об издании
  • Контакты
  • Рейтинг блогеров Highload

Присоединяйтесь к нам

clickhouse

Highload - 2 года назад

Использование AggregatingMergeTree в Clickhouse

Игорь Грегорченко

Технический редактор Highload

Даже колоночные базы данных, вроде Clickhouse, сталкиваются с проблемами слишком большого количества данных и слишком медленных запросов. Для таких случаев используют методики агрегирования данных, что позволяет экономить место и упрощать выборки.

Highload - 2 года назад

Сбор метрик из Nginx’a в Clickhouse

admin

Запись данных в Clickhouse (и другие векторные базы) может достигать производительности в миллионы строк в секунду. Для этого важно писать данные крупными пакетами (сотни тысяч…миллионы строк в пакете).

Highload - 2 года назад

JOIN нескольких таблиц в Clickhouse

Игорь Грегорченко

Технический редактор Highload

Поддержка JOIN’ов в Clichouse ограничена. Кроме непривычной работы самого объединения, есть еще и ограничение на последовательное объединение только двух таблиц:

Highload - 2 года назад

Truncate table в Clickhouse

admin

На текущий момент (февраль 2018) Clickhouse не поддерживает инструкцию TRUNCATE для полной очистки таблицы. Вместо этого можно удалить и пересоздать таблицу:

Highload - 2 года назад

Использование Clickhouse для фильтрации по колонкам

admin

Существует группа задач, которая связана с необходимостью фильтровать данные по большому количеству колонок в таблице. Например, в одном из наших аналитических решений, есть таблица товаров:

Highload - 3 года назад

Список партиций в ClickHouse

Игорь Грегорченко

Технический редактор Highload

Чтобы выбрать все партиции для всех таблиц нужно выполнить такой запрос:
SELECT * FROM system.parts
# вернет большую таблицу с кучей колонок

Highload - 3 года назад

Работа с JOIN в Clickhouse

Игорь Грегорченко

Технический редактор Highload

Clickhouse поддерживает JOIN таблиц с несколькими нюансами. Синтаксис привычный:

Highload - 3 года назад

Clickhouse: как узнать размеры таблиц?

Игорь Грегорченко

Технический редактор Highload

Чтобы вывести все таблицы на сервере Clickhouse с их размера в Гб, используйте этот запрос:
SELECT table, round(sum(bytes) / 1024/1024/1024, 2) as size_gb

Highload - 3 года назад

EXPLAIN в Clickhouse

admin

Clickhouse пока не поддерживает (февраль 2018) EXPLAIN и не имеет механизмов профилирования. Однако, можно использовать записи в логе для базового анализа эффективности запроса.

Highload - 3 года назад

Выполнение запросов к Distributed таблицам Clickhouse

admin

Движок Distributed в Clickhouse позволяет работать с большими объемами данных, которые распределены между множеством серверов. Движок Distributed позволяет задать шарды (сервера), на которых хранятся данные и читать/записывать их. Запись данных – это скорее функция для удобства, т.к. более управляемый подход состоит в том, чтобы записывать данные прямо на шарды самостоятельно. А вот чтение данных – это мега удобная функция Distributed таблицы.

Highload - 3 года назад

Использование индексов в Clickhouse

Игорь Грегорченко

Технический редактор Highload

Clickhouse — это колоночная база данных от Яндекс. База специально разработана для аналитических задач на больших объемах.

Highload - 3 года назад

Удаление и обновление данных в Clickhouse

Игорь Грегорченко

Технический редактор Highload

В Clickhouse нет поддержки удалений и обновлений. Однако существует большое [https://ruhighload.com/doc/clickhouse/ количество движков] для разных задач.

Highload - 3 года назад

Распределенное хранение данных в Clickhouse

admin

Рано или поздно объемы (аналитических) данных выходят за пределы возможностей одного сервера. В любом случае, если объем данных больше, чем 10Тб, пора думать о распределенном хранилище.

Highload - 3 года назад

Бекап и восстановление в Clickhouse

Игорь Грегорченко

Технический редактор Highload

Процедура бекапа и восстановления в Clickhouse связана с прямыми операциями с файлами и не требует никаких дополнительных инструментов. Физически эта база данных оперирует не таблицами, а партициями – частями таблиц.

Топ текстов недели
1.
Веб-архивы интернета: список действующих ресурсов
2.
Шифрование, фишинг, наркоторговля: киберпреступники осваивают ChatGPT
3.
«Когда сделал это впервые, я был в шоке»: 10 способов радикально улучшить свои финансы в 2023 году
4.
Новые возможности от Google: 13 бесплатных онлайн-курсов по разработке и Data Scienсе
5.
Официально: $10 млрд инвестиций Microsoft в разработчика ChatGPT пойдут на интеграцию Azure
6.
Стартовал набор на бесплатный практикум для фулстек-разработчиков
7.
Кому пишут рекрутеры: Djinni опубликовал статистику по направлениям
8.
Мобильные приложения: виды и особенности
9.
ВСУ ищет программистов и дизайнеров: актуальная подборка вакансий
10.
Что мы не знаем о мобильных прокси: как использовать все их возможности для бизнеса и улучшить стратегии?
  • Об издании
  • Наша редакция
  • Контакты
  • Политика конфиденциальности
  • Реклама в издании
  • Редакционные правила
  • Как отправить текст в редакцию

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.


Мы используем иллюстрации от Depositphotos


Поддержка серверов

Партнер по SEO

Решение сложных IT-задач

© Highload. 2021-2023

Ваша жалоба отправлена модератору

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить Отмена

Полезные решения для тех,
кто пишет код

Присоединяйтесь
к сообществу: