Data Science

Data Science met R

Ben je een data scientist? Wil je bedreven raken met R in RStudio? Niet alleen voor jouw datawetenschap, maar ook voor analyses en machine learning? Dan is deze training zeker iets voor jou.

Je leert onder andere hoe je de Tidyverse Stack van RStudio gebruikt, hoe je interactieve machine learning dashboards met Shiny ontwikkelt en hoe je R integreert met databanken, Spark en de tools als H2O voor machine learning.

Is de Data Science met R training iets voor mij?

  • Ja - want je wilt leren hoe ervaren consultants en trainers als data scientists R tijdens hun werk gebruiken
  • Ja - want je hebt ervaring met het maken van analyses
  • Ja - want je wilt meer weten over Shiny, Dplyr, Spark of H2O

Wat kan ik bereiken met deze training? 

De training bestaat uit presentaties, door onze ervaren consultants en trainers, over fundamentele basiskennis en direct gekoppeld aan interactieve oefeningen, zodat je ook zult gaan programmeren. Op die manier krijg je snel alle tools van R onder de knie.

Je leert onder andere over deze onderwerpen:

We hebben een groot aantal onderwerpen die we met de groep kunnen bespreken. Afhankelijk van de groep kunnen we ervoor kiezen om ons meer op bepaalde onderdelen te richten dan op andere.

Overzicht van de Rstudio Omgeving:

  • Hoe Rscripts te bouwen
  • Hoe RMarkdown te automatiseren

Overzicht van de R taal:

  • Types en Vectoren
  • Functionele Programmeer Stijl
  • Functionele Pipe-then operators `%>%`
  • Het Concept van een DataFrame

Overzicht van de Tidyverse:

  • Data Wrangling met Dplyr
  • Data Structuren met Tidyr
  • Grammar van Visualization met GGplot2
  • De daad van analyse
  • Functioneel programmeren via Purrr
  • Hoe je Tidy Pipelines kan bouwen
  • Nested DataFrames voor ML Pipelines
  • Lubridate - hoe om te gaan met datums
  • Forcats - hoe om te gaan met factoren
  • Stringr - oe om te gaan met strings
  • Repareer bestandssysteem problemen met FS

Introductie tot ML:

  • Hoe je lineare modellen kan interpreteren
  • Hoe je externe packages kan gebruiken
  • Review van goede methodologie

BigData Technologieën:

  • Leer Spark kennen met sparklyr
  • Maak verbinding met de cloud met BigRQuery
  • Vertaal dplyr code naar SQL voor Databases
  • Gebruik H20 voor gedistribueerde ML

Wat moet ik nog meer weten?

Enkele voorwaarden: 

Om de training te volgen hoef je geen ervaring te hebben met programmeren. Sterke analytische skills zijn voldoende.

Het is belangrijk dat je voor deze training jouw eigen laptop meeneemt. Jouw laptop dient aan de volgende eisen te voldoen:

  • Minimaal 8GB RAM
  • 25GB vrije ruimte op je harde schijf 
  • Een USB-aansluiting 
  • Voorzien van wifi 
  • Zorg dat zowel R als RStudio is geïnstalleerd op jouw laptop. Hier vind je de instructies om de software te installeren

Deze training wordt aangeboden door onze trainingspartner GoDataDriven

Contact opnemen
contact-us

Ons team staat voor je klaar

Stuur ons een bericht!

Of bel +31 (0)35 538 1921