Data Engineering

Spark Programming

Programmeren met Spark is een zeer grondige en zeer actieve manier om overzicht te krijgen van het complete Apache Spark platform. De intensieve training duurt drie dagen en is zeer geschikt voor data engineers, data analisten en data architecten zoals software engineers. Maar ook voor technische managers en professionals die werken bij IT-Operations.

Elk onderdeel van het Apache Spark platform komt aan bod met een toelichting en oefeningen in Spark via webgebaseerde Notebooks van DataBricks.

De Notebooks van Databricks zijn geïnspireerd op tools zoals IPython, Jupyter en Matlab. De Notebooks maken het voor je mogelijk om werkzaamheden en vragen voor data-analyses te coderen en om visualisaties te creëren door middel van je eigen Spark-cluster via een webbrowser.

Is de Spark Programming training iets voor mij? 

  • Ja - want je bent een data engineer, data analist, data architect of software ontwikkelaar of IT/Technical Manager
  • Ja - want je wilt Spark toepassen om Pipelines te gebruiken voor jouw data 
  • Ja - want je wilt graag werken op het Spark cluster en met Spark SQL interactieve query's voor het transformeren, te filteren en visualiseren van gegevens realiseren
  • Ja - zodra je al basiskennis van Python of Scala hebt 

Kennis van SQL is voor deze training is een pré, echter niet verplicht.

Wat kan ik bereiken met deze training? 

Je leert onder andere:

  • De belangrijkste API’s om Spark te gebruiken
  • Fundamentele basiskennis over het platform en mogelijke vervolgstappen van Spark
  • SQL
  • Andere geavanceerde tools om toegang te krijgen tot data 
  • De streamingmogelijkheden van Spark
  • De API’s van Spark voor machine learning 

Tijdens de training leer je fundamentele basiskennis van Spark. Daarnaast brengen we meer verdieping aan om je Spark programming skills te verbeteren voor het transformeren, filteren en visualiseren van gegevens.

Je doet ervaring op met:

  • Het gebruiken van de belangrijkste API’s van Spark om te werken met data 
  • Het experimenteren met typische gebruiksvoorbeelden voor Spark
  • Het bouwen van data pipelines met SparkSQL en DataFrames
  • Het analyseren van werkzaamheden binnen Spark door de UI en logging events te gebruiken

Wat moet ik nog meer weten?

Databricks

Xebia Academy is een officiële trainingspartner van Databricks. Dat betekent dat Xebia Academy uitsluitend trainingen verzorgt in Databricks Spark met gecertificeerde Spark instructeurs.

Enkele voorwaarden:

  • Basiskennis van de Python programmeertaal (bijv. kennis van de concepten vermeld onder Basics op learnpython.org) of Scala
  • Het is een pré als je bekend bent met de fundamenten van SQL, maar dit is geen vereiste
  • Het is belangrijk dat je voor deze training je eigen laptop meeneemt. Zorg ervoor dat Chrome is geïnstalleerd op je laptop.

Deze training wordt aangeboden door onze trainingspartner GoDataDriven

Contact opnemen
contact-us

Hoe kunnen we je helpen?

Heb je behoefte aan persoonlijk advies of vragen naar de mogelijkheden? Ons team bij Xebia Academy staat tot je dienst. Wij zijn hier om je te helpen.
Als je meer wilt weten over onze training op maat op jouw bedrijfslocatie, kijk dan eens op onze In-Company pagina.

Stuur bericht

Of geef ons een belletje

+31 (0)35 538 1921