Нетология [Нетология] Профессия - Data Scientist (2019)

  • Автор темы Arsenn32
  • Дата начала

Arsenn32

Премиум
Регистрация
8 Янв 2019
Сообщения
8.738
Лайки
205.147
Монетки
106882.5
Голосов: 3
4.8 5 0 3 https://sharewood.bizhttps://sharewood.biz/threads/%D0%9D%D0%B5%D1%82%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F-%D0%9F%D1%80%D0%BE%D1%84%D0%B5%D1%81%D1%81%D0%B8%D1%8F-data-scientist-2019.46446/
#1
Автор: Нетология
Название: Профессия - Data Scientist (2019)

1558353864511-png.32884


Описание:

Мощнейший курс по программированию от Нетологии. В сети были некоторые части материала, которые вызывали дикий восторг у людей. В этой раздаче находится весь материал.

Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.

Курс состоит из более чем 180 часов видео и домашних заданий от ведущих специалистов по Data Scientist компаний Mail.ru, Ivi и Avito.

Первые два набора уже удачно состоялись, и студенты вовсю погрузились в базовые алгоритмы ML, feature engineering, машинное зрение, Data Scientist в e-commerce, временные ряды и прогнозирование стоимости акций и других товаров. Их преподавателями стали эксперты из Yandex Data Factory, Rambler&Co, Сбербанк Технологии и теперь у вас появится возможность получить все необходимые знания и навыки для работы в области больших данных.

Программа обучения:

I Подготовительный блок:
Экспресс-обучение основным инструментам: Python 3, git, библиотеки numpy, pandas. Обзор основного математического аппарата: матричные операции, введение в статистику и проверку гипотез.

II Введение в data science, основные инструменты:
Что такое data science, big data, как это работает и где применяется. Эксплоративный анализ и библиотеки визуализации данных. Обзор методов машинного обучения в бибилотеке scikit-learn.

III Базовые алгоритмы и понятия машинного обучения:
Разбор основных задач и алгоритмов машинного обучения: деревья решений, метод k ближайших соседей, линейный классификатор и логистическая регрессия, кластеризация. Проверка точности модели. Проблема переобучения и борьба с ней: регуляризация, ансамблирование.

IV Feature engineering:
Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства.

V Рекомендательные системы:
Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем.

VI Распознавание изображений, машинное зрение:
Базовая теория. Обзор кейсов применения. Нейросети. Разбор реальных задач: рукописный ввод, детекция и сегментация объектов на изображении.

VII Обработка естественного языка (NLP):
Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты: что это такое и как с ними работать. Дистрибутивная семантика. Чатботы: разбор генерации текстов. Нейросети для NLP.

VIII Анализ временных рядов, прогнозирование:
Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов.

IX Общение с заказчиком:
Проекты машинного обучения: как выявить требования и оценить проект. Составление отчетов по исследованиям. Мастер-класс по презентации результатов.

X Data Science в маркетинге и e-commerce:
Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Разбор атрибуции маркетинговых расходов для увеличения дохода интернет-магазина.

XI Дополнительные инструменты, среды:
Экосистема Google: BigQuery, Dataflow, Dataproc, Datalab и др. Коммерческие решения HP: Vertica, Haven, IDOL, коннекторы данных. Решения от Amazon (AWS). Хранение и обработка данных в Clickhouse.

XII Дипломная работа:
Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса.

Что вы получите в результате обучения

Достигнутые результаты
Построена полносвязная нейросеть
Создан чат-бот для поиска авиабилетов
Построен классификатор изображений
Созданы рекомендательные системы для музыкального и киносайта
Создан готовый к внедрению ml-проект

Ключевые навыки
Сбор и подготовка данных для анализа
Создание нейросетей
Генерация текстов и изображений
Создание рекомендательных систем
Выбор и реализация алгоритма под задачу
Выбор и создание фич для модели

Объем материала: ~ 165 GB

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
 

Отзывов в теме: 3

Регистрация
25 Апр 2019
Сообщения
12
Лайки
18
Монетки
69
Отзыв о продукте. Оценка: #8
Спасибо! Структура слегка скомкана, но остальное на высшем уровне.
 

zilog81_z

Премиум
Регистрация
10 Окт 2019
Сообщения
2
Лайки
0
Монетки
10
Отзыв о продукте. Оценка: #25
Отличный курс, он открыл мне дверь в ДС и выдал благославенный пендаль :)
 

ezh1lk

Премиум
Регистрация
31 Июл 2018
Сообщения
9
Лайки
2
Монетки
1
#2
Папка "05" является дублем "03" и внутри только 1 файл, что ооочень странно. Скорее всего при загрузке не заметили ошибку
 

Уилл Скарлет

Хранитель Шервуда
Команда форума
Администратор
Регистрация
22 Фев 2018
Сообщения
12.803
Лайки
187.301
Монетки
47797.5
#4
Регистрация
10 Мар 2019
Сообщения
4
Лайки
1
Монетки
0.5
#6
Регистрация
4 Дек 2018
Сообщения
2
Лайки
1
Монетки
0.5
#7
Вот и я об этом! Всё таки, всё ли хорошо со структурой? Папка 3 и папка 5 - так и должно быть? Спасибо!
Скорее всего да, ибо там внутри разные файлы. А так надо начать учить, дабы понять в чем дело. Удачи в изучении
 

toxianec

Премиум
Регистрация
19 Май 2018
Сообщения
34
Лайки
14
Монетки
12
#11
если честно сама подача материала так себе, код объясняется слабо, и все видеться из далека
 

Nikola_92

Премиум
Регистрация
13 Май 2019
Сообщения
2
Лайки
0
Монетки
10
#13
если честно сама подача материала так себе, код объясняется слабо, и все видеться из далека
Там в файлах есть один файлик со ссылкой на гитхаб. Вот на нем весь код, показываемый на презентации, представлен на гите в доступном формате
 

datascientist

Премиум
Регистрация
4 Июл 2019
Сообщения
3
Лайки
1
Монетки
5.5
#14
Начал смотреть курс, к раздаче вопросов нет (пока).
По курсу: препод по питону очень слабый - не подготовился, постоянно забывает какие-то детали, не знает результат сложения двух типов разных переменных, объясняет очень топорно, так что питон лучше сами подучите где-нибудь. по DS пока все хорошо
 

mihtw3

Премиум
Регистрация
23 Июл 2019
Сообщения
2
Лайки
0
Монетки
0
#15
Есть вопрос к тем, кто скачал курс: это нормально, что некоторые видеоуроки в данном курсе невозможно скачать(предположительно, битые файлы)?
Недавно на форуме, и до этого с таким явлением не сталкивался
Автору спасибо за курс, пока хорошо идёт
 

Klompster

Премиум
Регистрация
10 Апр 2019
Сообщения
15
Лайки
84
Монетки
66
#16
Начал смотреть курс, к раздаче вопросов нет (пока).
По курсу: препод по питону очень слабый - не подготовился, постоянно забывает какие-то детали, не знает результат сложения двух типов разных переменных, объясняет очень топорно, так что питон лучше сами подучите где-нибудь. по DS пока все хорошо

я тебе по секрету скажу, в нетологии по питону вообще так себе преподы. За весь курс не скажу, но именно питон полный провал
 

kvn_2001

Премиум
Регистрация
14 Окт 2018
Сообщения
3
Лайки
0
Монетки
0
#17
В модуле 3 в теме 3 "Линейный классификатор, логистическая регрессия" все 6 видео относятся к предыдущей теме 2 "Метод k ближайших соседей" - то есть видео темы 2 дублируются, видео темы 3 отсутствуют. Тему 3 придется изучать по презентации и блокнотам
 

Mr.Iron Man

Премиум
Регистрация
5 Май 2019
Сообщения
19
Лайки
12
Монетки
17
#18
В модуле 3 в теме 3 "Линейный классификатор, логистическая регрессия" все 6 видео относятся к предыдущей теме 2 "Метод k ближайших соседей" - то есть видео темы 2 дублируются, видео темы 3 отсутствуют. Тему 3 придется изучать по презентации и блокнотам
 

yelanihk

Премиум
Регистрация
15 Фев 2019
Сообщения
15
Лайки
9
Монетки
15
#19
Нетология очень низкоуровневый сервис. Читает курс человек, слабо представляющий Python.
Видео по некоторым урокам снято сбоку из зала, видно как ходит человек и голос преподавателя недостаточно громкий.
Такие видео размером до 1-2 Гб. Сам курс - 165Гб, что вообщем ни в какие ворота не лезет.
По сути после выкачки курса его надо самому дополнительно обработать:
- сжать видео
- из плохих видеоуроков выдернуть звук.дорожку
и т.д.
На сайте Нетологии по другим курсам админы/суппорт отвечают неторопливо и нехотя.
 
Сверху Снизу