Лекториум / Каталог курсов / ВВЕДЕНИЕ В ДАННЫЕ
Лекториум / Каталог курсов / ВВЕДЕНИЕ В ДАННЫЕ

ВВЕДЕНИЕ
В ДАННЫЕ

Вы научитесь основам анализа данных и выполните свой собственный исследовательский проект

28 лекций с заданиями
Чат в «Телеграме» с авторами
Свободное расписание
Сертификат
Присоединяйтесь к курсу в любое время! В бесплатном режиме доступен первый модуль. В платном — доступ к остальным модулям, заданиям и сертификации
Записаться
Прослушав этот курс, вы:
  • Научитесь разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Сможете грамотно описывать распределения, а также красиво и понятно визуализировать данные
  • Научитесь решать простые задачи, которые аналитики компаний — лидеров рынка решают каждый день
  • Узнаете, как анализировать данные при помощи SPSS и R
  • Попробуете себя в роли аналитика данных, выполнив свой исследовательский проект
Авторы курса — аналитики компании 2GIS Наталья Галанова и Виктор Демин, а также преподаватель Новосибирского государственного университета, социолог-исследователь Ольга Ечевская — имеют многолетний опыт решения прикладных и исследовательских задач и с удовольствием поделятся своим опытом с вами.
Посмотреть трейлер для студентов
Посмотреть трейлер для специалистов
Для кого

Курс будет полезен всем, кто:

  • Начинает изучать анализ данных и хочет разобраться на простых и понятных примерах
  • Хочет стать аналитиком данных и сформировать базу актуальных знаний и навыков
  • Имеет опыт работы с данными и хочет освежить знания основ
  • Работает с аналитиками данных и хочет понимать их
  • Так или иначе имеет дело с данными и хочет попрактиковаться в решении актуальных рыночных задач на реальных данных
Зачем
  • Научиться разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Попрактиковаться в решении простых задач, которые аналитики крупных компаний рынка решают каждый день
  • Познакомиться с инструментами анализа данных — SPSS и R
  • Попробовать себя в решении актуальных аналитических задач
Авторский подход
Этот курс — результат совместной работы преподавателя анализа данных в НГУ Ольги Ечевской и аналитиков компании 2GIS Натальи Галановой и Виктора Демина.

Ценность курса — в комбинации системной и доступной подачи материала и практических кейсов, построенных на реальных данных компании 2GIS.
Нажмите на карточку, чтобы узнать больше
программа курса
Этот курс — первый в специализации «Анализ данных». Курс будет особенно полезен тем, кто имеет небольшой опыт работы с данными или хочет освежить знания по теории вероятностей, математической статистике и типам данных.
  • Сначала мы вспомним основы теории вероятностей и поговорим о случайных величинах и их свойствах, основных распределениях случайных величин.
  • Затем перейдем к основным характеристикам распределений: мерам центра и мерам вариативности.
  • Далее обсудим основные типы шкал измерения признаков, а также основные ограничения, которые тип шкалы накладывает на применимые методы анализа данных.
Кроме того, поговорим о графическом анализе данных, способах визуализации распределений, выборках и о том, как их правильно формировать. Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS. Присоединяйтесь!
Модуль 1. Основы теории вероятностей
В первом модуле курса мы вспомним основы теории вероятностей. Мы поговорим о вероятности и ее свойствах, случайных величинах и их характеристиках, а также об основных распределениях случайных величин и их ключевых свойствах. Этот модуль формирует основы для понимания принципов, на которых строится статистический анализ данных.

Материалы к курсу:
  • О чем этот курс и как он устроен
  • Дополнительные материалы по статистическим пакетам
  • Данные, на которые мы опираемся и ссылаемся

Видеолекции:
  • Введение в теорию вероятностей
  • Свойства вероятности
  • Характеристики случайных величин
  • Непрерывные распределения. Часть 1
  • Нормальные и логнормальные непрерывные распределения
  • Дискретные распределения
Модуль 2. Основы статистического анализа выборочных данных
В этом модуле мы поговорим об описательных статистиках и двух типах характеристик распределений: мерах центральной тенденции (или просто мерах центра, что типично для исследуемого распределения) и мерах вариативности (или мерах разброса, т. е. насколько разнообразны значения признака, распределение которого исследуется). Для начала мы разберемся с типами данных, немного поговорим о выборках, а затем рассмотрим основные меры центра и разброса, применимые для данных разных типов. В завершении модуля мы посмотрим, как рассчитываются описательные статистики в SPSS и R.

Видеолекции:
  • Типы данных
  • Выборка случайных величин
  • Меры центральной тенденции
  • Меры вариативности. Материал к лекции 2.4. (текст) Обзор способов расчета процентилей и межквартильного размаха
  • Несмещенная дисперсия
  • Меры и типы переменных: что и где применимо?
  • Практика 1. Описательные статистики в R
  • Практика 2. Описательные статистики в SPSS
Модуль 3. Графический анализ данных
В этом модуле мы займемся графическим анализом данных. Сначала мы увидим, как по-разному могут выглядеть распределения, обладающие похожими характеристиками. Затем рассмотрим основные виды графиков, поймем области их применения и основные ограничения для каждого графического инструмента. В практической части курса мы научимся строить графики в SPSS и R.

Видеолекции:
  • Почему важно визуализировать данные. Квартет Энскомба
  • Гистограмма и методы ее построения
  • Box plot, или Ящик с усами
  • Диаграмма рассеяния
  • Графики для неметрических шкал
  • Практика 1. Построение графиков в R
  • Практика 2. Построение графиков в SPSS
Модуль 4. Формирование выборок и подготовка данных
В этом модуле мы поговорим о том, как строить выборки, а также научимся работать с пропущенными и неопределенными данными. Мы рассмотрим основные виды выборок, научимся рассчитывать необходимый объем выборки и ошибку выборки, а также разберем, как кодировать пропущенные и неопределенные данные и что делать с ними дальше. В практической части модуля мы научимся формировать массив данных в SPSS так, чтобы сэкономить время на этапе обработки и анализа данных.

Видеолекции:
  • Выборки
  • Ошибки выборки
  • Определение необходимого объема выборки
  • Работа с пропущенными наблюдениями
  • Кодирование неопределенных ответов
  • 4.6. Формирование массива данных в SPSS. Практика
Итоговый тест и оцениваемое задание
  • Итоговый тест
  • Практическое задание

Дополнительный материал: данные для выполнения задания
Специализация «Анализ данных»
Этот курс — часть специализации. Вы можете приобрести сразу четыре курса со скидкой 15%
Авторы
Ольга Ечевская
Социолог-исследователь, кандидат социологических наук, преподаватель курса «Анализ данных» в Новосибирском государственном университете
Виктор Демин
Аналитик данных компании 2GIS, Team lead, кандидат технических наук
Наталья Галанова
Аналитик данных компании 2GIS.
Как выглядит курс
Введение в данные

Прослушав этот курс, вы:

  • Научитесь разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Сможете грамотно описывать распределения, а также красиво и понятно визуализировать данные
  • Научитесь решать простые задачи, которые аналитики компаний — лидеров рынка решают каждый день
  • Узнаете, как анализировать данные при помощи SPSS и R
  • Попробуете себя в роли аналитика данных, выполнив свой исследовательский проект
Что вы получите
  • 4 модуля, 28 видеолекций
  • Практическое задание для отработки навыков на реальных данных компании 2GIS
  • Авторская подача: просто, понятно, с примерами, разбором типичных ошибок, демонстрацией решения задач в SPSS и R
  • Свободное расписание: нет дедлайнов и сроков сдачи заданий
  • Задания для самопроверки
  • Тест после каждого модуля
  • Практическое задание для отработки навыков анализа данных
  • Профессиональное видео и современная графика
  • Быстрая связь с техподдержкой и чат с автором
  • В бесплатном режиме первый модуль доступен вам полностью. После оплаты обучения для вас откроется полный доступ к курсу, проверочным заданиям после каждого урока и сертификации
Зачем
  • Научиться разбираться в данных, понимать и преодолевать ограничения данных разных видов
  • Попрактиковаться в решении простых задачи, которые аналитики крупных компаний рынка решают каждый день
  • Познакомиться с инструментами анализа данных — SPSS и R
  • Попробовать себя в решении актуальных аналитических задач
Присоединяйтесь к курсу в любое время! В бесплатном режиме доступен первый модуль. В платном — доступ к остальным модулям, заданиям и сертификации
FAQ
Когда я получу доступ к курсу?
Первый модуль курса доступен сразу после записи. После оплаты обучения вам будет открыт полный доступ к видеолекциям, заданиям и сертификации.
Как проходит обучение?
Все обучение проходит онлайн. Вы изучаете уроки и общаетесь с сокурсниками и автором в чате.
Что делать, если не успел сдать задание вовремя?
В нашем курсе нет дедлайнов и сроков. Вы можете проходить его в комфортном темпе.
Будут ли вебинары?
В нашем курсе нет вебинаров. Вы можете общаться с автором в чате.
Какой интернет и какое устройство нужно для комфортной учебы?
Для просмотра лекций вам подойдет практически любое устройство (компьютер, телефон, планшет), на котором вам комфортно работать. Скорость интернета должна быть такой, чтобы можно было без задержек смотреть потоковое видео, например с YouTube. Выполнять тесты и выпускать сертификаты удобнее на компьютере.
Можно ли скачать урок?
Нет, вы учитесь на онлайн-платформе и смотрите потоковое видео.
Реквизиты курса
Длительность курса

5 недель
Организаторы

Новосибирский государственный университет, 2 GIS
Click to order
Total: 
После оплаты дождитесь оповещения об успешном платеже. Квитанцию и доступ к курсу мы пришлем на вашу почту
Переходя к оплате, вы принимаете публичную оферту и даете согласие на обработку ваших персональных данных.
Находясь на сайте, вы даете согласие на обработку файлов cookie. Это необходимо для более стабильной работы сайта
Понятно