<p>Введение в аналитику данных</p>
Подробнее

Начните разбираться в принципах и методах анализа, визуализации и интерпретации данных

 

Аналитик данных (или дата-аналитик) — это специалист, который собирает, обрабатывает, изучает и интерпретирует данные. Его работа помогает принимать решения в бизнесе, управлении и науке. Обычно такие специалисты работают в компаниях, которые практикуют data-driven подход — ориентируются на данные и их анализ при принятии решений.

Программа курса поможет вам освоить принципы и методы анализа, визуализации и интерпретации данных. Вы изучите весь процесс анализа данных, от сбора и очистки данных до визуализации и передачи данных.

 

Полученные навыки предварительной обработки, очистки и визуализации данных с использованием таких инструментов, как Excel, Python, Tableau, Power BI, помогут вам начать свой путь в карьере аналитика данных.

 

О программе

 

 

Чему вы научитесь

<p>Основы работы с данными</p>
<p>Методы обработки данных</p>
<p>Основы анализа данных</p>
<p>Прогнозирование и предсказание</p>
<p>Основы машинного обучения</p>
<p>Популярные библиотеки</p>
<p>SQL</p>
<p>Платформы для анализа данных</p>
<p>Библиотеки машинного обучения</p>

Модуль 1. Основы языка Python

- Установка программного обеспечения и подключение к сервисам. Переменные и типы
- Условные и циклические операторы в языке Python
- Встроенные функции, строки, символы и регулярные выражения
- Списки, кортежи, множества и диапазоны
- Работа с датой и временем, обработка исключений
- Пользовательские функции
- Модули и пакеты
- Работа с файлами и каталогами
- Объектно-ориентированное программирование

 

Модуль 2. Введение в аналитику данных. Python для анализа данных

- Введение в сводные таблицы
- Применение сводных таблиц для маркетинговой сегментации
- Применение машинного обучение к данным в Google Таблицах
- Обзор типов данных Pandas
- Библиотеки визуализации данных Matplotlib, Seaborn, Altair, Autoviz, Plotly Express
- Применение pandas для анализа и обработки данных
- Разведочный анализ данных с использованием библиотек Pandas Profiling, Sweetviz, Dataprep, D-Tale
- Библиотеки автоматизации для разведочного анализа данных (Mitosheet, Bamboolib)

 

Модуль 3. Машинное обучение на Python

- Машинное обучение для решения задач Data Mining
- Алгоритмы построения деревьев решений
- Бустинг. AdaBoost и градиентный бустинг над решающими деревьями
- Введение в кластерный анализ. Фреймворки машинного обучения
- Анализ временных рядов
- Автоматическое машинное обучение

 

Модуль 4. Технологии формирования многомерной интерактивной отчетности

- Аналитические технологии Loginom
- Разработка дашбордов и проведение сторителлинга в Tableau Public
- Разработка интерактивных отчетов в Power BI
- Визуализация данных в Superset

 

 

ТДата – ведущий российский разработчик программного обеспечения для построения хранилища данных и аналитики. ТДата занимается разработкой, развитием и сопровождением продуктов платформы управления данными для коммерческих заказчиков и в интересах ПАО «Ростелеком».

Как проходит обучение

<p>Обучение проходит полностью дистанционно</p>
<p>Обучение поделено на модули</p>
<p>Практические задания проверяются экспертами</p>
<p>Изучение каждого учебного модуля ограничено дедлайном</p>

Ответы на вопросы

Мы рекомендуем уделять до 20 часов на обучение в неделю. Изучать материалы программы вы можете в любое время, главное — вовремя выполнять практические задания. 

Если у вас есть среднее профессиональное или высшее образование, по завершению обучения вы получите удостоверение о повышении квалификации установленного образца.

В начале обучения вы будете подключены к закрытому Telegram-чату, где сможете оперативно получить помощь от экспертов и команды поддержки, в случаях, если у вас возникнут сложности с изучением материалов.    

Для комфортного обучения на курсе вам подойдет ноутбук или стационарный компьютер, рекомендуемые требования:
• операционная система: Windows 10 или более поздняя версия (64-разрядная среда), macOS 11 или более поздняя версия;
• процессор: двухъядерный процессор с тактовой частотой 3.3 ГГц или выше;
• оперативная память: минимум 8 Гб, рекомендуется 16 Гб.