«Введение в Datа science и большие данные. Профессия Data Scientist с нуля»

258 часов
Продолжительность
Смотрите условия участия на profidigital.gosuslugi.ru
"Введение в Datа science и большие данные" - профессия Data Scientist с нуля
Аналитик данных проводит статистические тесты, чтобы решить бизнес-проблемы, на которые пока нет ответа. Он работает с разными инструментами анализа, не ограничиваясь готовыми решениями и системами. Владеет базовыми знаниями языка программирования Python и формулирует гипотезы.

Курс поможет вам не только с нуля овладеть всеми важными для аналитика данных навыками, но и научит мыслить абстрактно, видеть за метриками и показателями смысл, находить взаимосвязи и строить гипотезы.
Datа science востребованы на рынке
130 000₽
зарплата аналитика middle уровня с опытом работы 1-2 года
23 655
Вакансий аналитика на HeadHunder (hh.ru)
67%
Специалистов пришли в аналитику из совершенно других сфер
*источник данных HeadHunter (hh.ru)
Программа курса
ТЕМА 1.1 Предмет, метод и задачи статистики
ТЕМА 1.2 Статистическое наблюдение: этапы организации, формы и способы, точность
ТЕМА 1.3 Первичная обработка данных статистического наблюдения, абсолютные и относительные статистические величины, средние величины, вариационный анализ
ТЕМА 1.4 Функциональная, статистическая и коррелиционная связи. Коррелиционный анализ, непараметрические методы обнаружения взаимосвязей
На этом курсе вы научитесь:
Работать с формами отчетности и современной организацией государственной статистики РФ, производить первичную обработку данных статистического наблюдения, анализировать параметры уравнения регрессии.
ТЕМА 2.1 Выборочное наблюдение (I): понятие, виды, определение численности выборочной совокупности
ТЕМА 2.2 Выборочное наблюдение (II): способы отбора, статистическое распределение выборки, эмпирическая функция распределения, полигон и гистограмма
ТЕМА 2.3 Выборочное распределение (III): числовые характеристики вариационного ряда, статистические и интервальные оценки параметров распределения
ТЕМА 2.4 Ряды динамики: понятие и виды, показатели, методы анализа тенденций и измерения созонных колебаний, прогнозирование, анализ структурных изменений
ТЕМА 2.5 Статистические индексы
ТЕМА 2.6 Отраслевая статистика
ТЕМА 2.7 Статистические показатели по отраслям
ТЕМА 2.8 Использование отраслевых и агрегированных показателей для обогащения данных
На этом курсе вы научитесь:
Прогнозировать показатели временного ряда, строить на основе данных полигоны и гистограммы, линейную диаграмму динамического ряда, сможете применять статистические и интервальные оценки параметров распределения. Вы научитесь производить выравнивание исходного динамического ряда методами укрупненных интервалов, скользящей средней, аналитического выравнивания по уравнению прямой, овладеете методиками расчета индексов, а также расчёта средних темпов роста и прироста, сможете использовать отраслевые и агрегированные показатели для обогащения данных.
ТЕМА 3.1 Определение Больших данных, Атрибуты БД
ТЕМА 3.2 Принципы работы с БД. Аналитические инструменты работы с большими данными – MapReduce, Hadoop, R.
ТЕМА 3.3 Жизненный цикл данных. Базы данных. Основные подходы и инструменты в работе с базами данных
ТЕМА 3.4 Основные виды БД. Сбор данных. Методы автоматического сбора данных
ТЕМА 3.5 Подготовка данных к анализу: формат данных, типы переменных, выбор переменных, конструирование признаков, неполные данные
ТЕМА 3.6 Ключевые подходы к обработке данных: кластеризация, тепловые карты
На этом курсе вы научитесь:
Искать пути повышения эффективности результатов анализа больших данных за счёт уточнения атрибутов, применять аналитические инструменты работы с большими данными – MapReduce, Hadoop, R, производить планирование и управление базой данных предприятия, осуществлять подготовку данных к анализу, решать практические задачи по кластеризации и составлению тепловых карт.
ТЕМА 4.1 Введение в машинное обучение. Обзор алгоритмов обучения без учителя. Обзор алгоритмов обучения с учителем
ТЕМА 4.2 Выбор алгоритма (обучение с учителем, обучение без учителя, обучение с подкреплением). Факторы, влияющие на выбор алгоритма. Настройка параметров
ТЕМА 4.3 Оценка результатов: метрики классификации, метрика регрессии, валидация
ТЕМА 4.4 Выведение линии тренда. Градиентный спуск. Коэффициенты регрессии. Коэффициенты корреляции. Ограничения. Метрики регрессии
ТЕМА 4.5 Метрики классификации. Кластеризация методом k-средних. Метод главных компонент
На этом курсе вы научитесь:
Применять алгоритмы обучения без учителя и с учителем, проводить оценку результатов использования данных: метрики классификации, метрика регрессии, валидация, сможете использовать методики построения моделей: выведение линии тренда, градиентный спуск, проводить кластеризацию методом k-средних и методом главных компонент.
ТЕМА 5.1 Основные элементы парсинга, принципы и типовые алгоритмы
ТЕМА 5.2 Создание базовых скриптов для извлечения данных из сети Интернет
На этом курсе вы:
Составлять типовые алгоритмы парсинга на Pyton для поиска данных, создавать базовые скрипты для извлечения данных из сети Интернет.
ТЕМА 6.1 Эволюция NLP технологий, подходы к получению векторного представления слов
ТЕМА 6.2 Использование набора NLP моделей, технологий на основе Python
ТЕМА 6.3 Введение в обработку изображений
ТЕМА 6.4 Классификация и сегментация изображений
На этом курсе вы научитесь:
Получать векторное представление слов, использовать набор NLP моделей, а также технологии на основе Python для работы с большими данными, производить классификацию и сегментацию изображений.
ТЕМА 7.1 Управление, основанное на данных: определение и роли
ТЕМА 7.2 Принципы работы с данными (удобство использования, составление таблиц и диаграмм, установление закономерностей и поиск среднего)
ТЕМА 7.3 Инструменты управления, основанного на данных
ТЕМА 7.4 Интерпретация результатов анализа. Сравнительный анализ результатов
ТЕМА 7.5 Особенность управления в ИТ БЕ
На этом курсе вы научитесь:
Составлять типовые алгоритмы парсинга на Pyton для поиска данных, создавать базовые скрипты для извлечения данных из сети Интернет.
Кому подойдет курс?
Наш курс подойдет вам, даже если ваш опыт работы максимально далек от аналитики. Вам не потребуется специальных знаний, выходящих за рамки школьной программы. На специализации вы получите достаточную подготовку, чтобы решать задачи аналитика уровня junior. А если в вашей текущей работе есть пересечения с аналитикой, вы пополните свое портфолио десятком решенных задач и кейсов.
Как проходит обучение
Видео-уроки
Вам будут доступны видео-уроки в профессиональном качестве, которые можно просматривать любое количество раз
Практика
Вы будете выполнять практические задания и прикреплять их к ответу на урок. Эти кейсы можно будет использовать в своем портфолио
Обратная связь
Преподаватель проверяет ваши задания, указывает на ошибки и отвечает на все вопросы в комментариях к уроку или в телеграмм чате
Онлайн-встречи
Каждые две недели преподаватель проводит zoom-встречу, где вы можете задать свои вопросы в прямом эфире
Раздаточный материал
К каждому уроку приложены pdf-файлы, которые вы можете скачать себе
Диплом о профессиональной переподготовке
В конце обучения при условии успешной сдачи итоговой работы вы получаете диплом установленного образца с регистрацией в ФРДО
Доступ к курсу
При условии успешного завершения обучения доступ ко всем материалам курса доступен вам в течение двух месяцев
Преподаватели курса
Охрименко Алексей Арнольдович
к.э.н., МГУ имени М.В. Ломоносова, Экономический факультет, Кафедра статистики, доцент
ведущий специалист Центра компетенций НТИ по направлению «Технологии хранения и анализа больших данных» на базе МГУ имени М.В. Ломоносова
Николаева Инга Юрьевна
Отзывы
Общая оценка
4,0
4,0
Признателен ООО "Центр образовательных компетенций НТИ" за предоставленную возможность познакомиться с DS и BD и получить необходимые знания для начала трудовой деятельности в новой для меня профессиональной сфере. Курс весьма мотивирующий и поддерживающий в новых начинаниях людей, ранее не связанных c миром IT. Спасибо!
Абянов Ансар
4,0
Удобная форма обучения. Техническая поддержка. Классный коллектив.
Зайцев Сергей
В курс входят: эконометрика, базы данных, нейронные сети, машинное обучение. Жаль что вместо эконометрики не было математической статистики. Курс в общем хороший.
4,0
Александр Немцев
Очень интересный, насыщенный и полезный в прикладном направлении курс.
4,0
Воронин Тимофей
4,0
Компактный по времени, насыщенный по содержанию, прекрасно структурированный ознакомительный курс, полностью, на мой взгляд, отвечающий своему названию. Подача лекционного материала оформлена не в самой зажигательной, по современным меркам, манере, но в традиционном академическом ключе. Достаточное количество промежуточных тестов для самодиагностики. Также безусловным плюсом является качественная обратная связь от преподавателей и индивидуализированный подход.

Оксана Капустина
В соответствии с пп. 2 п.1 ст.219 НК РФ слушатель вправе получить налоговый вычет и вернуть 13% от суммы оплаченной за обучение.

Общество с ограниченной ответственностью «Центр образовательных компетенций НТИ» (Лицензия Министерства образования и науки Серия №10539 от 24 августа 2020 г., выданной Министерством образования и науки Республики Татарстан, срок действия бессрочно), именуемое в дальнейшем «Провайдер», в лице генерального директора Цыганковой Регины Сергеевны, действующего на основании Устава, настоящим предлагает любому физическому лицу, именуемому в дальнейшем «Пользователь», достигшему возраста, допустимого в соответствии с законодательством Российской Федерации для акцепта настоящего предложения и обладающему соответствующими полномочиями, акцептировать настоящую публичную оферту на условиях, указанных ниже.
Close
Остались вопросы?
Ваше Имя
Ваш телефон
Ваш email
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой конфиденциальности
© 2021 ООО "Центр образовательных компетенций НТИ"