Opis szkolenia
Platforma Apache Spark służy do przetwarzanie i analizy wielkich zbiorów danych. Platforma rozwijana jest na zasadach open source, oprócz funkcji przetwarzania zbiorów posiada interfesjy API dla różnych języków programowania (Scala, Python, Java i R). Apach Spark coraz częściej używany przez programistów, inżynierów i analityków.
Cele
Szkolenie z instalacji Apache Spark przeznaczone jest dla adminstratorów i programistów, którzy zaczynają swoją przygodę ze SPARKiem. W trakcie szkolenia uczestnicy zapoznają się z następującymi zagadnieniami:
- Tryby pracy Apache Spark
- Prezentacja instalacji w trybie local
- Warsztaty – instalacja Yarn + Spark z dystrybucji Cloudery (w podgrupach)
- Informacje o alternatywnych dystrybucjach (Hortonworks, DC/OS)
Prowadzący
Artur Czeczko (ICM UW)