Data Science

Data Science met Python

Deze training leert je over de software packages en tools benodigd voor Data Science met Python. Tijdens deze training raak je bedreven met Python en de meest belangrijke en gerelateerde tools.

We behandelen alles wat je nodig hebt om jouw dagelijkse Data Science vraagstukken te beantwoorden. Zo leer je onder andere werken met Pandas, Matplotlib en Scikit-learn. Verder laten we je zien hoe je Jupyter Notebooks kunt gebruiken. Bovendien laten we je ook zien hoe je de command line kunt gebruiken om jouw dagelijkse werkzaamheden te versnellen.

"The training gave me a lot of grip/insights on the subject. How to use pandas / clean up your data and plotting it were for me the most interesting parts." - Configuration Manager, KPN

Is de Data Science met Python training iets voor mij?

  • Ja - als je wilt leren om jouw data op te schonen en te manipuleren met Python
  • Ja - als je wilt leren om Data Science modellen te ontwikkelen
  • Ja - als je wilt weten hoe je jouw data kunt visualiseren

Wat kan ik bereiken met deze training? 

Door middel van door de trainer geleide discussie en interactieve hands-on oefeningen leer je hoe Python te gebruiken voor Data Science. 

Je leert onder andere over deze onderwerpen: 

Overzicht van de Jupyter Omgeving:

  • Samenvatting van de functionaliteiten
  • Magic Cell Methoden
  • Hoe Bash Commands te runnen
  • Hoe een overzicht te bewaren

Overzicht van het Numpy Ecosysteem:

  • Begrijpen waar de prestatie vandaan komt
  • Begrijpen van sommige limieten op de prestatie
  • Begrijpen van Broadcasting
  • Begrijpen van Shape conventies
  • Bekijken van enkele van de betere functies van het hulpprogramma

Overzicht van het Pandas Ecosysteem:

  • Begrijpen hoe je data wrangling taken moet uitvoeren
  • Begrijpen hoe aggregaties te customizen
  • Leer moderne pandas pipelines te schrijven
  • Begrip van staatloze transformaties
  • Leer hoe je het loggen in pandas automatiseert
  • Zie de functionaliteit van de string/date assessor

Overzicht van Visualization:

  • Snel overzicht van Matplotlib
  • Snel overzicht van Graphic Grammers via Plotnine

Introductie Scikit-Learn Pipelines

  • Introductie tot Machine Learning Models
  • Introductie tot Data Transformers
  • Introductie tot Data Estimators
  • Hoe je deze twee kan combineren tot een pipeline
  • Hoe je alles kan automatiseren in een GridSearch
  • Hoe je je eigen bouwblokken kan schrijven

Wat moet ik nog meer weten?

Enkele voorwaarden:

  • Om ervoor te zorgen dat je het maximale uit deze training kunt halen verwachten we een basiskennis van de Python programmeertaal (bijv. kennis van de concepten vermeld onder Basics op learnpython.org)
  • Voor de training gebruiken we een online leeromgeving op instruct.com waarvoor je een laptop met werkende wifi nodig hebt. Je hoeft geen software op je laptop de installeren voor de training, maar als je ons materiaal achteraf op je eigen laptop wil gebruiken dan moet je python installeren (ten minste versie 3.6). Veel mensen vinden het makkelijk om dit te installeren door de Anaconda distributie te installeren.

Deze training wordt aangeboden door onze trainingspartner GoDataDriven

Contact opnemen
contact-us

Ons team staat voor je klaar

Stuur ons een bericht!

Of bel +31 (0)35 538 1921