Data Engineering

Apache Airflow

Apache Airflow, een middel voor het orkestreren van big data, stelt je in staat de voordelen van big data maximaal te benutten. Apache Airflow is een technologie voor het organiseren van alle data processen binnen de organisatie, met als doel rauwe data te transformeren naar betrouwbare en beter bruikbare informatie en kennis. Airflow helpt met het verbinden van de databronnen en het inzichtelijk maken van de afhankelijkheden. Bovendien maakt Airflow het mogelijk om dit op een uniforme manier binnen je gehele organisatie te doen: een grote stap in de richting van data-excellentie.

Wij zijn er sterk van overtuigd dat het in beweging brengen van data door middel van het bouwen van data pipelines, het toepassen van machine-learning op de data, en het verwerken ervan tot input voor modellen en dashboards het kloppende hart voor de gehele organisatie wordt. De meeste organisaties hebben moeite hun dataproducten op een uniforme manier te beheren.

Door data pipelines te automatiseren en organiseren zorgt Apache Airflow ervoor dat je organisatie grip heeft op de dataverwerking om zo de voorsprong op de concurrentie te vergroten. 

Is de Apache Airflow training iets voor mij?

  • Ja – als je een data scientist bent
  • Ja – als je een data engineer bent
  • Ja – als je je dataproducten naar productie wilt brengen

Wat kan ik bereiken met deze training?

Je leert onder andere:

  • Een algemene inleiding tot Airflow, inclusief voorbeelden waarin Airflow het verschil maakt
  • Een hands-on oefening in het gebruik van Airflow, en het schrijven van een DAG die interactief samenwerkt met componenten van Google Cloud, onder andere BigQuery, DataFlow, Cloud SQL en Cloud Storage
  • Hoe je eigen operators, hooks en sensors ontwikkelt op basis van de Airflow-internals

Je doet ervaring op in: 

  • Het Airflow-ecosystem
  • Hoe je Airflow kunt toepassen in verschillende situaties
  • Het bouwen en automatiseren van data-pipelines

Je ontwikkelt de vaardigheden om: 

  • Apache Airflow te gebruiken en beheren
  • Data-pipelines te bouwen en beoordelen
  • Airflow naadloos te integreren in je eigen data-landschap

Wat moet ik nog meer weten?

Enkele voorwaarden:

  • Om ervoor te zorgen dat je het maximale uit deze training kunt halen verwachten we een basiskennis van de Python programmeertaal (bijv. kennis van de concepten vermeld onder Basics op learnpython.org
  • Basisprincipes van data engineering

Vereisten:

  • Het is belangrijk dat je voor deze training jouw eigen laptop meeneemt met toegang tot het internet

Deze training wordt aangeboden door onze trainingspartner GoDataDriven

Contact opnemen
contact-us

Hoe kunnen we je helpen?

Heb je behoefte aan persoonlijk advies of vragen naar de mogelijkheden? Ons team bij Xebia Academy staat tot je dienst. Wij zijn hier om je te helpen.
Als je meer wilt weten over onze training op maat op jouw bedrijfslocatie, kijk dan eens op onze In-Company pagina.

Stuur bericht

Of geef ons een belletje

+31 (0)35 538 1921