Instalacja Apache Spark w środowisku rozproszonym – szkolenie zamknięte

Opis szkolenia

Platforma Apache Spark służy do przetwarzanie i analizy wielkich zbiorów danych. Platforma rozwijana jest na zasadach open source, oprócz funkcji przetwarzania zbiorów posiada interfesjy API dla różnych języków programowania (Scala, Python, Java i R). Apach Spark coraz częściej używany przez programistów, inżynierów i analityków.

Cele

Szkolenie z instalacji Apache Spark przeznaczone jest dla adminstratorów i programistów, którzy zaczynają swoją przygodę ze SPARKiem. W trakcie szkolenia uczestnicy zapoznają się z następującymi zagadnieniami:

  1. Tryby pracy Apache Spark
  2. Prezentacja instalacji w trybie local
  3. Warsztaty – instalacja Yarn + Spark z dystrybucji Cloudery (w podgrupach)
  4. Informacje o alternatywnych dystrybucjach (Hortonworks, DC/OS)

Prowadzący

Artur Czeczko (ICM UW)
Skip to content