Работа с данными

Парсинг данных с сайтов: что это и на чьей стороне закон

Внедрение Big Data в разные сферы человеческой деятельности  полностью изменило наше восприятие бизнеса и технологий. Появилась необходимость использования специальных инструментов…

07.02.2023

Мир на пороге квантовой революции: какие у нас перспективы и что нужно знать о квантовых вычислениях

Привет! Меня зовут Сергей Пащенко, я Data Engineer в NIX и спикер IT-конференции NIX Multiconf. Я большой фанат машинного обучения,…

02.08.2022

«Пользуетесь дашбордами? Нет, только смотрим»: объясняем дата-анализ на мемах, понятных каждому

Казалось бы, как можно из такой фановой темы как мемы, рассказывать о серьезных вещах вроде Data Analysis и Business Intelligence?…

08.07.2022

Спрос на дата-инженеров вырастет: рассказываем, какую технологию сейчас изучать лучше всего

Объем информации в онлайне постоянно растет. Только представьте: ежедневно пользователи по всему миру создают 500 млн твитов, 294 млрд мейлов,…

22.06.2022

Лучшие книги по Data Science: топ-8 пособий, чтобы прокачаться в науке о данных

По данным DOU, одни из самых высоких зарплат в украинском IT сейчас — в Data Science. В топе по спросу…

22.02.2022

Учимся работать с базами данных: подробный гайд по MySQL для PHP-разработчика

Современные приложения производят все больше объемов данных. Таким образом растет необходимость структурировать все эти огромные массивы информации. Как это сделать?…

11.02.2022

Система поиска напоминает Google: что умеет Elasticsearch и зачем он нужен

По данным Fundacion Mapfre, каждую минуту более 4,5 млрд человек отправляют почти 42 млн сообщений в WhatsApp, 2704 раза устанавливают…

10.02.2022

Как начать карьеру в Data Science: пять реальных историй

Привет! Меня зовут Александра Богуславская, я СЕО и Founder в Data Science UA. В течение пяти лет наша компания построила…

06.12.2021

Что такое большие данные: коротко о главном

Вы никогда не задумывались над тем, как много новой информации появляется ежедневно в интернете? Простейшие события, скажем, открыли страничку Facebook…

22.11.2021

Работал на Большом адронном коллайдере, а теперь — дата-инженер в Ciklum: история айтишника с PhD в квантовой физике

Станислав Сучек — IT-свитчер. Но свитчнулся он из области куда сложнее, чем IT. Посудите сами: Станислав получил докторскую степень в…

12.11.2021

Специалистам по Machine Learning платят больше, чем разработчикам: как им стать, нужна ли математика и другие ответы от эксперта

На канале основателя школы программирования FoxmindEd Сергея Немчинского вышел стрим с Павлом Галушко. Павел — Tech Lead команды разработки для…

26.10.2021

Без SQL: учимся работать с данными на Elasticsearch

Elasticsearch — это поисковый и аналитический движок, с помощью которого ваша команда может быстро искать информацию в любых типах данных…

22.09.2021

MS SQL, не болей: 10 причин, почему не устанавливается Microsoft SQL Server (и что с этим делать)

Все сделали по инструкции, но MS SQL Server все равно бунтует? Можно пойти на какой-нибудь форум и пожаловаться там. Highload…

01.09.2021

Элемент случайности: как использовать модуль random в Python

Модуль random в Python дает возможность генерировать случайные числа и выбирать случайные элементы из списка. Но давайте обо всем по…

20.08.2021

Перевести с языка программистов на «понятный» и наоборот: кто такие бизнес-аналитики и чем они занимаются в IT

Привет! Меня зовут Михаил, я Junior Pre-sales Business Analyst в компании JMind. Я хочу немного рассказать о том, что такое…

22.07.2021

Как создать команду Data Science в продуктовой компании, используя опыт Google и Spotify

В этой статье я расскажу о том, как мы в YouScan строим Data Science Squad, что означает принцип you build…

31.05.2021

Лучшие подкасты, чтобы разобраться в Microsoft Power BI

Подкасты я открыла для себя примерно лет 11 назад, то есть задолго до того, как Clubhouse стал завоевывать сердца и…

19.05.2021

Microsoft Power BI: 4 платформы, чтобы прокачать навыки

Совершенствоваться в работе с софтом, в том числе и с Power BI, сегодня легко благодаря многочисленным онлайн-курсам и тьюториалам. Но…

21.04.2021

Решения на NoSQL базах

В этой статье рассмотрим принципы решения типичных задач в key-value базах данных.

19.12.2020

Горизонтальный шардинг

Так или иначе возникает ситуация, когда на сервере базы данных со временем приходится работать с огромными таблицами.

11.12.2020

Как скопировать выбранные ключи Redis на другой сервер?

[https://redis.io/ Redis] – простое, быстрое и удобное key-value хранилище данных. При масштабирование любого приложения возникает необходимость переноса данных между серверами.…

10.10.2020

Денормализация данных

Нормальная форма хранения данных предполагает избегания дублирования данных. Ключевых правила два:

03.08.2020

Ребалансировка данных при шардинге

При шардинге неизбежно возникает необходимость перебалансировать данные. Точно предсказать рост объема и формы данных практически невозможно. Поэтому ребалансировка данных –…

04.02.2020

Вертикальный шардинг

Обычно Web приложения работают с одним сервером базы данных. Почти всегда приложение использует более одной таблицы.

25.11.2019