Вебинар

«Работа с источниками данных в Apache Spark»

14 июн
Вт
Бесплатно

«Работа с источниками данных в Apache Spark»

Apache Spark – это Big Data фреймворк с открытым исходным кодом для распределённой пакетной и потоковой обработки неструктурированных и слабоструктурированных данных, входящий в экосистему проектов Hadoop.

Митап рассчитан на инженеров данных, разработчиков и просто интересующихся: научимся загружать данные в Sparkиз файлов и реляционных СУБД, а также выгружить данные, включая управление сжатием, вопросы  выбора формата файла и т.п. Во время митапа будет немного теории и много практики - будем вместе в облаке учиться работать с источниками данных в Spark. На выходе вы будете уметь читать файлы с помощью ApacheSpark, извлекать и записывать данные в реляционные СУБД, материалы митапа - Jupyterноутбуки - позволят вам продолжить изучение нюансов ввода и вывода в Sparkсамостоятельно. Для эффективного участия в митапе необходимо предварительное знакомство со Spark (хотя бы в объеме нашего предыдущих митапов).

Программа митапа

  1. Теория: краткое знакомство с возможностями ввода-вывода в ApacheSpark

Немного теории – как устроен ввод-вывод 

  1. Практика: Читаем и пишем данные с ApacheSpark

Файлы, форматы файлов, JDBCисточники

МЕРОПРИЯТИЕ БУДЕТ ПРОВОДИТЬСЯ НА ПЛАТФОРМЕ ZOOM. Ссылка на зум придет за час до начала мероприятия.

Контактная информация: info@bigdataschool.ru или +7 (495) 41-41-121, +7 (915) 307 0074

 

Похожие мероприятия

Конференция
Gamedev Weekend 2022
13 - 14 авг
Сб-Вс
Новосибирск, Россия
 
Подробнее

Рекомендуем