Лекториум / Каталог курсов / Исследование статистических взаимосвязей
Лекториум / Каталог курсов / Статистические взаимосвязи

Исследование статистических взаимосвязей

Вы научитесь находить взаимосвязи, оценивать и обосновывать их значимость и выполните исследовательский проект на реальных данных компании 2GIS

34 лекций с заданиями
Чат в «Телеграме» с авторами
Свободное расписание
Сертификат
Присоединяйтесь к курсу в любое время! В бесплатном режиме доступен первый модуль. В платном — доступ к остальным модулям, заданиям и сертификации
Записаться
Прослушав этот курс, вы:
  • Научитесь анализировать взаимосвязи между признаками, оценивать силу и значимость этих взаимосвязей
  • Сможете грамотно выбрать статистический инструмент под вашу задачу исходя из ограничений имеющихся данных
  • Освоите принципы проверки статистических гипотез о взаимосвязи признаков
  • Узнаете, как считать корреляции, строить таблицы сопряженности и регрессионные модели в SPSS и R
  • Попробуете себя в роли аналитика данных, выполнив свой исследовательский проект
Авторы курса — преподаватель Новосибирского государственного университета, социолог-исследователь Ольга Ечевская и аналитики компании 2GIS Наталья Галанова и Виктор Демин — имеют многолетний опыт решения прикладных и исследовательских задач и с удовольствием поделятся своим опытом с вами.
Посмотреть трейлер для студентов
Посмотреть трейлер для специалистов
Для кого

Курс будет полезен всем, кто:

  • Изучает анализ данных и хочет разобраться на простых и понятных примерах
  • Знает основы анализа данных и хочет прокачаться в изучении взаимосвязей и построении моделей линейной регрессии
  • Хочет научиться работать в SPSS или R
  • Так или иначе имеет дело с данными и хочет научиться грамотно их анализировать
Зачем
  • Научиться находить и анализировать взаимосвязи
  • Попрактиковаться в решении актуальных рыночных задач на реальных данных
  • Научиться строить и анализировать модели линейной регрессии
  • Познакомиться с инструментами анализа данных — SPSS и R
  • Попробовать себя в решении актуальных аналитических задач
Авторский подход
Этот курс — результат совместной работы преподавателя анализа данных в НГУ Ольги Ечевской и аналитиков компании 2GIS Натальи Галановой и Виктора Демина.

Ценность курса — в комбинации системной и доступной подачи материала и практических кейсов, построенных на реальных данных компании 2GIS.
Нажмите на карточку, чтобы узнать больше
программа курса
Этот курс — второй в специализации «Анализ данных». Чтобы успешно его освоить, вам понадобятся знания основ теории вероятностей и математической статистики. Если вы не уверены в своих знаниях, рекомендуем начать с курса «Введение в данные».
Курс расскажет вам, как понять, связаны ли признаки между собой, как измерить силу такой взаимосвязи и оценить ее значимость. Мы начнем с обзора типов данных и ограничений, которые вытекают из размерности анализируемых признаков. Затем мы разберем основные инструменты статистической оценки взаимосвязей: таблицы сопряженности, коэффициенты корреляции, модели линейной регрессии. Научимся интерпретировать их смысл и оценивать качество построенных моделей.
Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS.
Вводные материалы о специализации
  • Вводная лекция: структура и содержание специализации
  • Тексты:
— О чем этот курс и как он устроен
— Дополнительные материалы по статистическим пакетам
— Данные, на которые мы опираемся и ссылаемся
Модуль 1. Введение в статистические критерии
В этом модуле мы поговорим о логике проверки статистических гипотез. Вы узнаете, чем статистическая гипотеза отличается от обычного предположения, какие бывают статистические гипотезы и какие статистические критерии разработаны для их проверки. В результате вы научитесь формулировать статистические гипотезы для решения исследовательских задач, а также выбирать подходящие критерии для их проверки. Этот модуль создает основу для следующих модулей курса, в которых на примерах рассматривается применение разных статистических критериев.

  • Статистическая гипотеза
  • Статистические критерии
  • Алгоритм проверки статистических гипотез
  • Свойства критериев
  • Метод Монте-Карло
Модуль 2. Критерии согласия
В этом модуле мы разберем один из классов статистических критериев, которые позволяют проверять соответствие распределения признаков известным законам распределения. Форма распределения — это не менее важное ограничение для применения статистических методов, чем тип шкалы, в которой измерен признак. Если не учитывать связанные с ней ограничения, то можно сделать некорректные статистические выводы. Многие меры и методы работают только в том случае, если признак распределен в соответствии с известным законом (к примеру, имеет нормальное распределение). Изучив этот модуль, вы научитесь определять такие соответствия.

  • Гипотеза о согласии
  • Критерий согласия хи-квадрат
  • Группирование данных
  • Критерий согласия Колмогорова — Смирнова
  • Критерии типа Омега
  • Критерий Шапиро — Уилка
  • Практика 1. Построение критериев согласия в R
  • Практика 2. Построение критериев согласия в SPSS
Модуль 3. Поиск взаимосвязей в данных и оценка их статистической значимости
В этом модуле мы поговорим о способах выявления статистических взаимосвязей. Рассмотрим методы, применимые для выявления взаимосвязей признаков в зависимости от шкалы измерения и формы распределения признака, научимся определять силу и значимость связей между признаками. Применение основных методов оценки взаимосвязей мы разберем на реальных данных; к примеру, проверим, что важнее для того, чтобы человек был удовлетворен жизнью: материальное благополучие или уважение окружающих. Кроме того, мы покажем, как рассчитывать основные коэффициенты связи в R и SPSS.

  • Понятие статистической взаимосвязи: идея и основные виды
  • Исследование взаимосвязей: разные шкалы — разные инструменты
  • Линейные взаимосвязи между двумя признаками. Коэффициенты корреляции
  • Проверка значимости коэффициентов корреляции
  • Таблицы сопряженности: введение
  • Исследование взаимосвязей при помощи критерия хи-квадрат
  • Таблицы сопряженности: исследование силы и характера взаимосвязи
  • Пример исследования взаимосвязей на основе таблиц сопряженности
  • Практика 1. Вычисление коэффициента корреляции в R
  • Практика 2. Исследование взаимосвязей в SPSS: коэффициенты корреляции и таблицы сопряженности
Модуль 4. Линейная регрессия
В заключительном модуле курса мы поговорим о модели линейной регрессии, которая позволяет не только делать вывод о связи между признаками, но и строить прогноз, т. е. рассчитывать значение одного (зависимого) признака, зная значения других, определяющих его. Мы начнем с общей идеи модели, поговорим о возможностях и ограничениях инструмента. Затем на примере пошагово разберем, как построить модель линейной регрессии, как оценить ее качество и как построить прогноз на основе модели. Базовый пример модуля — модель, построенная на реальных данных, предоставленных компанией 2GIS.

  • Модель линейной регрессии: основная идея
  • Типы данных
  • Оценки параметров регрессии
  • Оценка качества модели
  • Отбор значимых признаков
  • Мультиколлинеарность
  • Гетероскедастичность
  • Проверка предположений о модели
  • Прогноз
  • Практика 1. Линейная регрессия в R
  • Практика 2. Линейная регрессия в SPSS
Специализация «Анализ данных»
Этот курс — часть специализации. Вы можете приобрести сразу четыре курса со скидкой 15%
Авторы
Ольга Ечевская
Социолог-исследователь, кандидат социологических наук, преподаватель курса «Анализ данных» в Новосибирском государственном университете
Виктор Демин
Аналитик данных компании 2GIS, Team lead, кандидат технических наук
Наталья Галанова
Аналитик данных компании 2GIS.
Как выглядит курс
Исследование статистических взаимосвязей

Прослушав этот курс, вы:

  • Научитесь анализировать взаимосвязи между признаками, оценивать силу и значимость этих взаимосвязей
  • Сможете грамотно выбрать статистический инструмент под вашу задачу исходя из ограничений имеющихся данных
  • Освоите принципы проверки статистических гипотез о взаимосвязи признаков
  • Узнаете, как считать корреляции, строить таблицы сопряженности и регрессионные модели в SPSS и R
  • Попробуете себя в роли аналитика данных, выполнив свой исследовательский проект
Что вы получите
  • 4 модуля, 34 видеолекции
  • Авторская подача: просто, понятно, с примерами, разбором типичных ошибок, демонстрацией решения задач в SPSS и R
  • Практическое задание на реальных данных компании 2GIS
  • Свободное расписание: нет дедлайнов и сроков сдачи заданий
  • Задания для самопроверки
  • Тест после каждого модуля
  • Практическое задание для отработки навыков анализа данных
  • Профессиональное видео и современная графика
  • Быстрая связь с техподдержкой и чат с автором
  • В бесплатном режиме первый модуль доступен вам полностью. После оплаты обучения для вас откроется полный доступ к курсу, проверочным заданиям после каждого урока и сертификации
Зачем
  • Научиться находить и анализировать взаимосвязи
  • Попрактиковаться в решении актуальных рыночных задач на реальных данных
  • Научиться строить и анализировать модели линейной регрессии
  • Познакомиться с инструментами анализа данных — SPSS и R
  • Попробовать себя в решении актуальных аналитических задач
Присоединяйтесь к курсу в любое время! В бесплатном режиме доступен первый модуль. В платном — доступ к остальным модулям, заданиям и сертификации
FAQ
Когда я получу доступ к курсу?
Первый модуль курса доступен сразу после записи. После оплаты обучения вам будет открыт полный доступ к видеолекциям, заданиям и сертификации.
Как проходит обучение?
Все обучение проходит онлайн. Вы изучаете уроки и общаетесь с сокурсниками и автором в чате.
Что делать, если не успел сдать задание вовремя?
В нашем курсе нет дедлайнов и сроков. Вы можете проходить его в комфортном темпе.
Будут ли вебинары?
В нашем курсе нет вебинаров. Вы можете общаться с автором в чате.
Какой интернет и какое устройство нужно для комфортной учебы?
Для просмотра лекций вам подойдет практически любое устройство (компьютер, телефон, планшет), на котором вам комфортно работать. Скорость интернета должна быть такой, чтобы можно было без задержек смотреть потоковое видео, например с YouTube. Выполнять тесты и выпускать сертификаты удобнее на компьютере.
Можно ли скачать урок?
Нет, вы учитесь на онлайн-платформе и смотрите потоковое видео.
Реквизиты курса
Длительность курса

5 недель
Организаторы

Новосибирский государственный университет, 2 GIS
Click to order
Total: 
После оплаты дождитесь оповещения об успешном платеже. Квитанцию и доступ к курсу мы пришлем на вашу почту
Переходя к оплате, вы принимаете публичную оферту и даете согласие на обработку ваших персональных данных.
Находясь на сайте, вы даете согласие на обработку файлов cookie. Это необходимо для более стабильной работы сайта
Понятно