Дата мероприятия: 25.03.2021.
Формат мероприятия: online.
Автор: Иван Трусов, Solutions Architect, Databricks.
Материалы первого доклада:
- Запись выступления на YouTube.
Delta Lake — эффективный OSS формат для построения надежных и управляемых data lakes поверх облачных хранилищ.
В рамках этого доклада рассмотрим практические области применения, трехслойную архитектуру раскладки данных (bronze-silver-gold), а так же различные особенности Delta-формата, упрощающие ETL процессы.
Автор: Паша Финкельштейн, Developer Advocate for Big Data, JetBrains.
Материалы второго доклада:
- Запись выступления на YouTube.
- Презентация на сайте автора.
Спарк поддерживается множеством языков, одних только официально поддерживаемых языков 4.
Так какого же рожна Паша написал поддержку ещё одного JVM языка и чего это ему стоило? Как устроены кишки и на какие компромиссы пришлось пойти? Попробуем узнать ответ на этот вопрос вместе.