
Программирование и количественные методы для нетехнических профессий
Е-Центр запускает новый курс, ориентированный на людей, не имеющих опыта программирования или применения количественных методов анализа данных, но желающих получить новые навыки в сфере сбора и анализа данных: студентов и исследователей из социальных наук, журналистов, экспертов в сфере публичной политики. Курс состоит из двух модулей, в рамках которых рассматриваются все основные этапы, которые исследователь обычно проходит при выполнении исследовательской работы: сбор данных, чистка и трансформация данных, визуализация и анализ данных.
Фокусом первого модуля будут стратегии сбора данных в сети Интернет с помощью парсинга информации, размещенной на веб-сайтах. Онлайн революция в средствах обмена информацией, появление социальных сетей и цифровизация многих сфер человеческой жизни сформировали обширное море информации и данных, доступных для сбора и анализа. Аналитики данных, специалисты по исследованию рынков, академические исследователи и студенты, журналисты и расследователи получили доступ к широким возможностям по сбору открытой информации и ответов на свои исследовательские вопросы. Проблемой в таком случае является не столько поиск информации вообще, сколько сбор релевантной информации наиболее эффективным способом, превращение ее в данные и подготовка их к анализу.
Второй модуль будет предназначен для тех, кто хочет получить базовые теоретические знания по статистике и практические навыки по чистке, трансформации, визуализации и анализу данных в статистической и программной среде R. Комбинация теоретических знаний по статистике и практических навыков программирования открывает для исследователей новые горизонты и новые возможности полезные возможности для выполнения задач по анализу данных, которые обычно предполагают трансформацию данных, визуализацию данных, расчет дескриптивных статистик и тестирование гипотез. Понимание базовых статистических понятий вкупе с подготавливать и корректно анализировать данные дает исследователям возможности делать обоснованные выводы о наличии причинно-следственных связей.
Модуль «Введение в парсинг и автоматизацию сбора данных в сети Интернет»
Темы (теория и практика)
1. Информация, данные и автоматизация: что такое информация, что такое данные и как автоматизировать превращение первого во второе. Самые часто встречающиеся форматы информации/данных, доступные в сети Интернет (сырые данные – текст и числа в тексте, таблицы, JSON-формат), типы веб-сайтов
2. Парсинг статического сайта: html-тэги и структура сайта, http-запросы, списки и оформление данных в виде датафрейма
3. Парсинг таблиц: таблицы как наиболее распространенный формат информации/данных в сети Интернет. Подходы к парсингу таблиц.
4. API и парсинг JSON: API, API-запросы и парсинг JSON
5. Парсинг динамического сайта: библиотека Selenium и доступ к контенту динамического веб-сайта
Преподаватель: Юрий Агафонов
Длительность: 4 недели, 5 сессий, 2 часа одна сессия
Начало: 27 февраля 2023
Стоимость: 35 000 драм
Язык: английский
Формат: офлайн
Что вы получите в результате:
- Базовые знания о Python (типы объектов, функции, http-запросы, API-запросы, трансформация данных с помощью библиотеки pandas)
- Базовые навыки парсинга для дальнейшего развития собственных знаний
- Примеры кода, которые можно применять в собственных проектах по сбору данных
Модуль «Введение в статистику, трансформацию, визуализацию и анализ данных»
Темы
Теоретическая часть
1. Случайная величина, функция распределения случайной величины, плотность распределения случайной величины.
2. Моменты случайной величины (математическое ожидание, дисперсия). Корреляция и ковариация. Закон больших чисел и центральная предельная теорема
3. Проверка статистических гипотез. Тест Стьюдента, критерий хи-квадрат.
4. Эмпирическая функция распределения, выборочные статистики
5. Линейная регрессия
Практическая часть
1. Количественные методы: история, инструменты, основные понятия. Знакомство с R и RStudio
2. Трансформация и визуализация данных: : принципы и инструменты
3. Статистические гипотезы и ошибки. Статистика хи-квадрат (𝜒2). Статистические тесты
4. Корреляция и ковариация. Расчёт коэффициентов корреляции. Построение корреляционных матриц
5. Парная и множественная МНК-регрессия. Диагностика регрессионных моделей
Что вы получите в результате:
- Базовые знания по статистике
- Базовые знания R и RStudio (библиотека tidyverse, базовые функции R)
- Базовые навыки в трансформации, визуализации и анализе данных в R
- Примеры кода, которые можно применять в собственных проектах по анализу данных
Преподаватель: Юрий Агафонов, Михаил Соколов
Длительность: 5 недель, 10 сессий, 2 часа одна сессия
Начало: 27 марта 2023
Стоимость: 48 000 драм
Язык: русский, английский
Формат: онлайн, офлайн
Скидка
Можно зарегистрироваться на весь курс или на отдельные модули. В случае выбора курса целиком, действует скидка 16%. Вместо 83 000 драмов курс будет стоить 70 000 драм.
Особые условия: если у вас есть особые запросы, потребности или вопросы (например, желаемый язык и формат сессий), пожалуйста, напишите нам, мы постараемся вам помочь.
Чтобы зарегистрировать это мероприятие отправьте свои данные по электронной почте nelly.aghabekyan@gmail.com
Зарегистрируйтесь с помощью веб-почты: Gmail / AOL / Yahoo / Outlook
Дата и время
2023-04-27