big data

big data: материалы на тему Big Data ⭐ Самые актуальные и полезные мануалы, инструкции и посты на сайте ➜ highload.today

«Пользуетесь дашбордами? Нет, только смотрим»: объясняем дата-анализ на мемах, понятных каждому

Казалось бы, как можно из такой фановой темы как мемы, рассказывать о серьезных вещах вроде Data Analysis и Business Intelligence?…

08.07.2022

Спрос на дата-инженеров вырастет: рассказываем, какую технологию сейчас изучать лучше всего

Объем информации в онлайне постоянно растет. Только представьте: ежедневно пользователи по всему миру создают 500 млн твитов, 294 млрд мейлов,…

22.06.2022

Корзина, полная змей: обзор популярных модулей и библиотек Python для Data Science

Это большой обзорный пост, который поможет новичкам  быстро сориентироваться в дебрях терминологии Data Science. Мы последовательно опишем все основные модули,…

05.04.2022

Система поиска напоминает Google: что умеет Elasticsearch и зачем он нужен

По данным Fundacion Mapfre, каждую минуту более 4,5 млрд человек отправляют почти 42 млн сообщений в WhatsApp, 2704 раза устанавливают…

10.02.2022

Способы фильтрации данных в Pandas

Фильтрация данных из фрейма данных — одна из наиболее распространенных операций при очистке данных. Pandas предоставляет широкий спектр методов для…

01.02.2022

«Я один из дураков, которые остались бы в IT, забери оттуда все деньги»: как попасть на работу в Apple — опыт украинского разработчика

Чтобы построить хорошую карьеру в IT и попасть в престижную компанию, не обязательно «нырять» в индустрию с головой при первой…

21.10.2021

«Работайте или проваливайте»: глава Xsolla объяснил массовые увольнения и намекнул на бонусы для сотрудников

Основатель и СЕО Xsolla Александр Агапитов принял решение уволить 10% сотрудников компании с самыми низкими зарплатами, потому что с их…

05.08.2021

Как чемпион мира по игре в го проиграл нейросети и при чем здесь современные видеоигры

Индустрия GameDev начиналась с 8-битного Mario и Sonic. Сейчас же это настоящие экосистемы, которые визуально не уступают кинофильмам. Это виртуальные…

03.07.2021

Использование AggregatingMergeTree в Clickhouse

Даже колоночные базы данных, вроде Clickhouse, сталкиваются с проблемами слишком большого количества данных и слишком медленных запросов. Для таких случаев…

22.12.2020

JOIN нескольких таблиц в Clickhouse

Поддержка JOIN’ов в Clichouse ограничена. Кроме непривычной работы самого объединения, есть еще и ограничение на последовательное объединение только двух таблиц:

12.10.2020

Работа с JOIN в Clickhouse

Clickhouse поддерживает JOIN таблиц с несколькими нюансами. Синтаксис привычный:

25.07.2020

Выгрузка данных из Google Analytics

Если вам необходимо выгружать данные из Google Analytics, можно воспользоваться обычным HTTP протоколом. В отличие от родных библиотек, для выгрузки…

26.06.2020

Использование индексов в Clickhouse

Clickhouse — это колоночная база данных от Яндекс. База специально разработана для аналитических задач на больших объемах.

24.02.2020

Удаление и обновление данных в Clickhouse

В Clickhouse нет поддержки удалений и обновлений. Однако существует большое [https://ruhighload.com/doc/clickhouse/ количество движков] для разных задач.

14.01.2020