Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Novosibirsk State University

Введение в данные

Novosibirsk State University via Coursera

This course may be unavailable.

Overview

Этот курс - первый в специализации "Анализ данных". Курс будет особенно полезен тем, кто имеет небольшой опыт работы с данными, или хочет освежить знания по теории вероятностей, математической статистике и типах данных.
Сначала мы вспомним основы теории вероятностей и поговорим о случайных величинах и их свойствах, об основных распределениях случайных величин.
Затем перейдем к основным характеристикам распределений: мерам центра и мерам вариативности. Далее обсудим основные типы шкал измерения признаков, а также основные ограничения, которые тип шкалы накладывает на применимые методы анализа данных.
Третья неделя курса посвящена графическому анализу данных и способам визуализации распределений, индивидуальных или совместных. Завершающий модуль курса посвящен выборкам и способам их формирования, а также принципам и инструментам работы с пропущенными и неопределенными значениями.
Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS.
Присоединяйтесь!

Узнать об образовательных программах Новосибирского государственного университета: https://education.nsu.ru/bachelor/

Syllabus

  • ОСНОВЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
    • В первом модуле курса мы вспомним основы теории вероятностей. Мы поговорим о вероятности и её свойствах, о случайных величинах и их характеристиках, а также об основных распределениях случайных величин и их ключевых свойствах. Этот модуль формирует основы для понимания принципов, на которых строится статистический анализ данных.
  • ОСНОВЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ВЫБОРОЧНЫХ ДАННЫХ
    • В этом модуле мы поговорим об описательных статистиках и о двух типа характеристик распределений: меры центральной тенденции (или просто меры центра: что типично для исследуемого распределения) и меры вариативности (или меры разброса: насколько разнообразны значения признака, распределение которого исследуется). Для начала мы разберемся с типами данных, немного поговорим о выборках, и затем рассмотрим основные меры центра и разброса, применимые для данных разных типов. В завершении модуля мы посмотрим, как рассчитываются описательные статистики в SPSS и в R.
  • ГРАФИЧЕСКИЙ АНАЛИЗ ДАННЫХ
    • В этом модуле мы займемся графическим анализом данных. Сначала мы увидим, как по-разному могут выглядеть распределения, обладающие похожими характеристиками. Затем рассмотрим основные виды графиков, поймём области их применения и основные ограничения для каждого графического инструмента. В практической части курса мы научимся строить графики в SPSS и в R.
  • ФОРМИРОВАНИЕ ВЫБОРОК И ПОДГОТОВКА ДАННЫХ
    • В этом модуле мы поговорим о том, как строить выборки, а также научимся работать с пропущенными и неопределенными данными. Мы рассмотрим основные виды выборок, научимся рассчитывать необходимый объем выборки и ошибку выборки, а также разберём, как кодировать пропущенные и неопределённые данные и что делать с ними дальше. В практической части модуля мы научимся формировать массив данных в SPSS так, чтобы сэкономить время на этапе обработки и анализа данных.
  • Практические задания
    • В этом модуле вам предстоит применить полученные в курсе знания на практике. Сначала пройдите итоговый тест, чтобы проверить полученные в курсе знания и навыки. Также вам предлагается выполнить небольшой самостоятельный проект на реальных данных, предоставленных компанией 2GIS: проанализировать данные самостоятельно, а также оценить сокурсников.

Taught by

Ольга Ечевская, Наталья Галанова and Виктор Дёмин

Reviews

Start your review of Введение в данные

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.