Лекториум / Каталог курсов / Специализация «Анализ данных»
Лекториум / Каталог курсов / Анализ данных

Специализация «Анализ данных»

Специализация состоит из 4 курсов. Вы научитесь разбираться в основных видах данных, понимать их возможности и ограничения, познакомитесь с инструментами анализа данных и попрактикуетесь в решении практических задач в популярных средах анализа данных SPSS и R.

120 видеолекций с заданиями
Чат в «Телеграме» с авторами
Свободное расписание
Сертификат
Присоединяйтесь к курсам в любое время! В бесплатном режиме доступен первый модуль каждого курса. В платном — доступ к видеолекциям 2 — 4 модулей каждого курса, тестовым и проектным заданиям, сертификату
Записаться
Вы научитесь:
  • Основным методам работы с количественными данными, в том числе основы теории вероятностей и математической статистики;
  • Инструментам исследования связей между признаками;
  • Строить прогнозы на основе регрессионных моделей;
  • Сравнивать группы, выделять группы методами кластерного анализа;
  • Строить классификации, визуализировать данные;
  • Интерпретировать и представлять результаты статистического анализа.
В курсах специализации мы рассмотрим, как оценить связь условий труда и удовлетворенности работой, как спрогнозировать количество кликов на сайт компании, как разделить университеты на классы, как выявить стратегии поиска работы и выбрать наиболее эффективную, как предсказать, вырастут ли показатели компании до конца года, отдаст ли клиент банка кредит в срок, а также множество других практических задач.
Кроме того, вы научитесь решать такие задачи в популярных средах анализа данных SPSS и R. В заключительной части каждого курса вам предстоит выполнить проект на реальных данных, который позволит применить полученные знания на практике.
Специализация разработана Новосибирским государственным университетом, одним из ведущих исследовательских университетов России и мира, совместно с 2GIS, известной международной технологической компанией, которая разрабатывает сервисы для комфортной жизни в городе.
Посмотреть трейлер для студентов
Посмотреть трейлер для специалистов
Для кого

Специализация будет полезна всем, кто:

  • Изучает анализ данных и хочет разобраться на простых и понятных примерах
  • Имеет дело с данными и хочет освежить или систематизировать свои знания
  • Хочет стать аналитиком данных и сформировать базу актуальных знаний и навыков
  • Работает с аналитиками данных и хочет понимать их язык
  • Хочет попрактиковаться в решении актуальных рыночных задач на реальных данных
Зачем
  • Научиться разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Сформировать базу актуальных знаний и навыков аналитика данных
  • Освоить основные статистические методы и инструменты: анализ распределений и таблиц сопряженности, корреляционный и регрессионный анализы, методы сравнения групп и классификации, факторный анализ и временные ряды, а также многие другие
  • Попрактиковаться в решении актуальных рыночных задач на реальных данных
  • Научиться представлять результаты анализа и грамотно визуализировать данные
  • Освоить популярные среды анализа данных — SPSS и R
Авторский подход
Специализация — результат совместной работы аналитиков компании 2GIS Натальи Галановой и Виктора Демина, а также преподавателя анализа данных в НГУ Ольги Ечевской.

Ценность специализации — в сочетании системной и доступной подачи материала, понятных иллюстрирующих примеров и практических кейсов, которые построены на реальных данных компании 2GIS.

Авторы курса имеют многолетний опыт решения прикладных и исследовательских задач и с удовольствием поделятся своим опытом с вами.
Нажмите на карточку, чтобы узнать больше
программа курса
Вы освоите основные методы работы с количественными данными, в том числе:
1
Основы теории вероятностей и математической статистики
2
Инструменты исследования связей между признаками
3
Построение прогнозов на основе регрессионных моделей и временных рядов
4
Методы статистического сравнения групп
5
Инструменты классификации и методы кластерного анализа
6
Алгоритмы построения выборок, инструменты очистки и визуализации данных
Например, вы сможете оценить, как связаны условия труда и удовлетворенности работой, спрогнозировать количество кликов на сайт компании, классифицировать университеты по привлекательности для поступления, выявить стратегии поиска работы и найти самую эффективную, предсказать, вырастут ли показатели компании до конца года, отдаст ли клиент банка кредит в срок, а также научитесь ставить и решать практические задачи самостоятельно. Кроме того, вы освоите инструменты решения таких задач в популярных средах анализа данных SPSS и R.
Специализация состоит из 4 курсов. Мы рекомендуем проходить их по порядку, но при необходимости вы сможете выбрать свою траекторию обучения.
Курс 1. Введение в данные
Курс будет особенно полезен тем, кто имеет небольшой опыт работы с данными или хочет освежить знания по теории вероятностей, математической статистике и типам данных.

Сначала мы вспомним основы теории вероятностей и поговорим о случайных величинах и их свойствах, об основных распределениях случайных величин. Затем перейдем к основным характеристикам распределений: мерам центра и мерам вариативности. Далее обсудим основные типы шкал измерения признаков, а также основные ограничения, которые тип шкалы накладывает на применимые методы анализа данных. Третья неделя курса посвящена графическому анализу данных и способам визуализации распределений, индивидуальных или совместных. Завершающий модуль курса посвящен выборкам и способам их формирования, а также принципам и инструментам работы с пропущенными и неопределенными значениями.

Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS.

Специализация «Введение в данные»
Курс 2. Исследование взаимосвязей
Курс рассматривает способы и инструменты исследования статистических взаимосвязей между признаками. Вы научитесь оценивать, связаны ли признаки, а также делать обоснованные выводы о том, значима ли эта связь статистически. Связаны ли богатство и счастье? Как связана потребительская активность людей с днем недели? Способствует ли наличие аккаунта в социальных сетях популярности корпоративного сайта? На вопросы такого рода вы сможете ответить, изучив этот курс.

В первом модуле курса мы поговорим о статистических гипотезах, способах их проверки и основных статистических критериях, которые для этого разработаны. Далее мы рассмотрим практические инструменты выявления статистических взаимосвязей признаков, измеренных разными типами шкал, а также способы оценки значимости этих связей. Также поговорим об основных коэффициентах взаимосвязи признаков, о том, как правильно выбрать коэффициент для решения конкретной задачи, и покажем, как рассчитывать коэффициенты связи в статистических пакетах.

В конце мы подробно рассмотрим модель линейной регрессии, которая позволяет не только выявлять взаимосвязи между признаками, но и строить прогноз, а также попрактикуемся в ее построении.

Специализация «Исследование взаимосвязей»
Курс 3. Сравнение и создание групп
Курс посвящен статистическому сравнению групп и категорий.

В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, о том, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок. Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Различия между группами случайны или закономерны? Курс научит искать ответы на такие вопросы.

Вторая половина курса посвящена выделению групп на основе эмпирических данных. Есть ли в данных структура? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные, узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи.

В практических роликах курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи для отработки полученных навыков.

Специализация «Сравнение и создание групп»
Курс 4. Тренды и классификации
В этом курсе мы поговорим о трендах и классификаторах. Анализ трендов помогает ответить на такие вопросы, как: растут ли продажи, увеличивается ли количество пользователей сервиса; если есть рост, то случайность это или закономерность; есть ли в данных сезонные колебания; как выделить тренд и как объяснить его?

Также мы поговорим о факторном анализе. Он позволяет найти скрытую переменную (или переменные), определяющую проявление множества других признаков, которые мы видим. Как найти такие скрытые переменные и понять, что за ними стоит?

В заключительной части курса поговорим о классификаторах, применение которых решает задачи отнесения объектов к тому или иному классу с определенной вероятностью, а также позволяет прогнозировать попадание нового объекта в определенный класс. Как предсказать исход события, зная основные характеристики действующего лица? Закончит ли слушатель курс, отдаст ли заемщик кредит? Как оценить точность прогноза и минимизировать ошибки? Мы разберемся с устройством обозначенных методов анализа данных и попрактикуемся в их применении.

Специализация «Тренды и классификации»
Авторы
Ольга Ечевская
Социолог-исследователь, кандидат социологических наук, преподаватель курса «Анализ данных» в Новосибирском государственном университете
Виктор Демин
Аналитик данных компании 2GIS, Team lead, кандидат технических наук
Наталья Галанова
Аналитик данных компании 2GIS.
Как выглядит курс
Специализация «Анализ данных»
Освоив все курсы специализации, вы:
  • Научитесь разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Сформируете базу актуальных знаний и навыков аналитика данных
  • Освоите основные статистические методы и инструменты: анализ распределений и таблиц сопряженности, корреляционный и регрессионный анализы, методы сравнения групп и классификации, факторный анализ и временные ряды, а также многие другие
  • Попрактикуетесь в решении актуальных рыночных задач на реальных данных
  • Научитесь представлять результаты анализа и грамотно визуализировать данные
  • Освоите популярные среды анализа данных — SPSS и R
Авторы курса — преподаватель Новосибирского государственного университета, социолог- исследователь Ольга Ечевская и аналитики компании 2GIS Наталья Галанова и Виктор Демин — имеют многолетний опыт решения прикладных и исследовательских задач и с удовольствием поделятся своим опытом с вами. Добро пожаловать на курс!
Что вы получите
  • 4 курса, 120 видеолекций, 24 скринкаста с разбором задач, 4 практических проекта
  • Много практики, живые и понятные примеры, пошаговые руководства к решению практических задач в SPSS и R
  • Авторская подача: просто, понятно, с примерами, разбором типичных задач и ошибок, демонстрацией решения задач в SPSS и R
  • Практические задания для отработки навыков на реальных данных компании 2GIS
  • Профессиональные видео, современная графика, анимация, скринкасты
  • Задания для самопроверки, тесты для проверки знаний, практические задания для отработки навыков анализа данных
  • Свободное расписание: нет дедлайнов и сроков сдачи заданий
  • Быстрая связь с техподдержкой и чат с автором
  • В бесплатном режиме первый модуль каждого курса доступен вам полностью. После оплаты обучения для вас откроется полный доступ ко всем лекциям, проверочным заданиям и сертификации
Зачем
  • Научиться разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Сформировать базу актуальных знаний и навыков аналитика данных
  • Освоить основные статистические методы и инструменты: анализ распределений и таблиц сопряженности, корреляционный и регрессионный анализы, методы сравнения групп и классификации, факторный анализ и временные ряды, а также многие другие
  • Попрактиковаться в решении актуальных рыночных задач на реальных данных
  • Научиться представлять результаты анализа и грамотно визуализировать данные
  • Освоить популярные среды анализа данных — SPSS и R
Присоединяйтесь к курсам в любое время! В бесплатном режиме доступен первый модуль каждого курса. В платном — доступ к видеолекциям 2 — 4 модулей каждого курса, тестовым и проектным заданиям, сертификату
FAQ
Когда я получу доступ к курсу?
Первый модуль каждого курса доступен сразу после записи. После оплаты обучения вам будет открыт полный доступ ко всем видеолекциям, заданиям и сертификации.
Как проходит обучение?
Все обучение проходит онлайн. Вы изучаете уроки и общаетесь с сокурсниками и автором в чате.
Что делать, если не успел сдать задание вовремя?
В нашем курсе нет дедлайнов и сроков. Вы можете проходить его в комфортном темпе.
Будут ли вебинары?
В нашем курсе нет вебинаров. Вы можете общаться с автором в чате.
Какой интернет и какое устройство нужно для комфортной учебы?
Для просмотра лекций вам подойдет практически любое устройство (компьютер, телефон, планшет), на котором вам комфортно работать. Скорость интернета должна быть такой, чтобы можно было без задержек смотреть потоковое видео, например с YouTube. Выполнять тесты и выпускать сертификаты удобнее на компьютере.
Можно ли скачать урок?
Нет, вы учитесь на онлайн-платформе и смотрите потоковое видео.
Реквизиты курса
Длительность курса

20 недель (4 курса по 5 недель)
Организаторы

Новосибирский государственный университет, 2 GIS
Click to order
Total: 
После оплаты дождитесь оповещения об успешном платеже. Квитанцию и доступ к курсу мы пришлем на вашу почту
Переходя к оплате, вы принимаете публичную оферту и даете согласие на обработку ваших персональных данных.
Находясь на сайте, вы даете согласие на обработку файлов cookie. Это необходимо для более стабильной работы сайта
Понятно