Opleiding Data Science en Big Data Analytics met R (Certified)

Tijdsduur

Opleiding Data Science en Big Data Analytics met R (Certified)

Tridata B.V.
Logo van Tridata B.V.
Opleiderscore: starstarstarstarstar_border 8 Tridata B.V. heeft een gemiddelde beoordeling van 8 (uit 1 ervaring)

Tip: meer info over het programma, prijs, en inschrijven? Download de brochure!

Startdata en plaatsen

Er zijn nog geen startdata bekend voor dit product.

Beschrijving

Beschrijving

Data science is de wetenschap van het verzamelen, beheren en analyseren van data. Om geldige conclusies te kunnen trekken op basis van gegevens moet een data scientist kunnen denken in statistiek en algoritmen, data snel verkennen, data visualiseren en analyseren, en waar nodig programmeren en reproduceerbaar werken. Een data scientist kan bovendien de resultaten van een data-analyse communiceren, bijvoorbeeld in een rapport of presentatie met aantrekkelijke visualisaties. Tijdens de opleiding Data Science en Big Data Analytics van Tridata ga je hiermee aan de slag.

De opleiding data science met R duurt 12 dagen en is verdeeld over 15 weken. Wil je liever aan de slag met Pytho…

Lees de volledige beschrijving

Veelgestelde vragen

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Nog niet gevonden wat je zocht? Bekijk deze onderwerpen: Data science met R, R, Big Data, Data Analyse en Data Science.

Beschrijving

Data science is de wetenschap van het verzamelen, beheren en analyseren van data. Om geldige conclusies te kunnen trekken op basis van gegevens moet een data scientist kunnen denken in statistiek en algoritmen, data snel verkennen, data visualiseren en analyseren, en waar nodig programmeren en reproduceerbaar werken. Een data scientist kan bovendien de resultaten van een data-analyse communiceren, bijvoorbeeld in een rapport of presentatie met aantrekkelijke visualisaties. Tijdens de opleiding Data Science en Big Data Analytics van Tridata ga je hiermee aan de slag.

De opleiding data science met R duurt 12 dagen en is verdeeld over 15 weken. Wil je liever aan de slag met Python, meld je dan aan voor de Opleiding Data Science using Python.

Leervormen

De Opleiding Data Science en Big Data Analytics bestaat uit het verwerken van voorbereidend materiaal, zoals leeswerk of video’s. Tijdens de contactdagen wordt de stof verder eigen gemaakt door presentaties van onze deskundige docenten en het maken van opdrachten onder leiding van deze docenten. Ten slotte wordt er gewerkt aan een overkoepelende opdracht uit de praktijk die de cursisten zelf moeten formuleren. Deze opdracht wordt begeleid door onze docenten en de resultaten worden gepresenteerd aan het einde van de Opleiding Data Science.

Op de pagina Tridata Seminar Data Science vind je een selectie van de praktijkopdrachten die de deelnemers hebben gepresenteerd in de afgelopen vijf jaar.

Doelgroep

  • Business intelligence en data-analisten die hun kennis willen uitbreiden met datasciencevaardigheden;
  • (Team)managers van BI en data-analisten;
  • Academici die een carrière ambiëren als data scientist;
  • Specialisten die hun kennis over het analyseren van big data op peil willen houden.

Vereiste voorkennis en vaardigheden

Om de Opleiding Data Science succesvol af te sluiten wordt van de deelnemer een bepaald kennisniveau verwacht:

  • Minimaal afgeronde HBO/WO opleiding;
  • Goede basiskennis van basisstatistiek: begrippen uit de beschrijvende statistiek zoals centrummaten, spreidingsmaten, meetniveaus, en (co)variantie zijn bekend;
  • Bekendheid met statistische modellen zoals regressies is geen vereiste, maar zal helpen om het maximale rendement uit de opleiding te halen;
  • Ervaring in het programmeren met één of meerdere computertalen zoals R, Matlab, Stata, SAS,  SPSS, Python , C, C++, C#, Java, SQL of vergelijkbare computertalen is een pré.

Tijdens de opleiding zullen de opdrachten in R worden uitgevoerd. Wil je liever aan de slag met Python, meld je dan aan voor de Opleiding Data Science using Python.

Doel van de Opleiding Data Science en Big Data Analytics met R

Na afloop van de Opleiding Data Science en Big Data Analytics kunnen de deelnemers meedraaien in een data science team door:

  • Bedrijfsgegevens te vertalen naar visie en strategie;
  • Aan te geven hoe complexe datasets oplossingen kunnen bieden voor maatschappelijke uitdagingen;
  • Aan te geven hoe geavanceerde analysetechnieken ingezet kunnen worden om een voorsprong te creëren op concurrenten;
  • Geschikte analytische technieken en tools toepassen om Big Data te analyseren en hieruit inzichten te destilleren;
  • Onderzoeksresultaten te communiceren aan stakeholders en teamleden;
  • Hun vaardigheid in R, RStudio, Hadoop en Spark in te zetten voor data-analyses.

Je werkt met de feedback van de ervaren Tridatadocenten aan een eigen onderzoek.

Vanwege de breedte van de datasciencediscipline, wordt de opleiding data science van Tridata verzorgd door drie ervaren docenten, met elk hun eigen specialisatie.

Programma

De Opleiding Data Science en Big Data Analytics van Tridata bestaat uit vier blokken van elk drie weken. Het laatste blok wordt afgesloten met een middag waarin de deelnemers hun eigen onderzoek presenteren. Daarnaast wordt in elk blok minstens één casus uitgewerkt, van inlezen en opschonen van gegevens, tot analyseren en visualiseren van data.

Blok 1: inleiding, visualisatie, en communicatie
Waar kan statistical learning voor worden gebruikt? We maken kennis met enkele traditionele modellen voor het schatten van numerieke en categoriale variabelen. Ook zullen we ingaan op het inrichten van een datascienceproject en het visualiseren en rapporteren van resultaten.

– Inleiding statistical learning, modellen en modelfouten, beoordelen van modellen
– Regressiemethoden en methoden voor classificatie
– Denken in de datawaardeketen, rapporteren en visualisatie

Blok 2: predictive machine learning
Machinelearningmodellen zijn traditioneel vooral bedoeld om schattingen te kunnen maken van individuele gebeurtenissen, zoals: in welke advertentie is deze bezoeker van mijn website het meest geïnteresseerd? Met moderne methoden kunnen machinelearningmodellen echter ook gebruikt worden voor het ontdekken van verbanden tussen variabelen.

– Tree models, Random Forest, bagging, boosting, GBM
– Neurale netwerken, Support vector machines
– Unsupervised learning
– Interpretable Machine Learning, open de Machine Learning black box

Blok 3: tekstmining en tekstanalyse mbv machine learning-technieken
Het product van een datascienceproject bestaat uit de data, de resultaten, en de code die is gebruikt. In dit blok gaan we in op software-engineeringmethoden die relevant zijn voor data science. Inhoudelijk wordt ingegaan op het structureren, visualiseren en analyseren van tekstdata.

– Beheer van data science scripts en code
– Web scraping, textextractie uit verschillende formaten
– Het bouwen van een web-API
– Tekstmining, informatie-extractie, tekstclassificatie, en topic models

Blok 4: tijdreeksanalyse (forecasting), netwerkanalyse en presentatie eigen onderzoek
Niet alle gegevens zijn eenvoudig in de vorm van records (relationele data) weer te geven. Tijdreeksen en netwerken hebben een eigen structuur waardoor specifieke analysemethoden nodig zijn. Tegelijkertijd biedt die structuur kansen, zoals forecasting bij tijdreeksen, of het zoeken van belangrijke elementen zoals influencers of gemeenschappen in een netwerk.

– Tijdreeksen: ontleden, autocorrelatie, forecasting
– Inleiding netwerkanalyse: visualisatie, community detection, centraliteit
– Inleiding werken met Big Data (Spark, Hadoop)
– Presentatie eigen opdracht. Op de pagina Tridata Seminar Data Science vindt u een selectie van de praktijkopdrachten die de deelneemers hebben gepresenteerd in de afgelopen vijf jaar.

Kosten en inschrijving

De kosten van de 12-daagse opleiding Data Science bedragen € 6900. De kosten van de opleiding Data Science zijn vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken w.o. An Introduction to Statistical Learning, koffie/thee en lunches.

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

De cursus duurt 12 dagen (één dag per week). Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

Certificering

Deelnemers krijgen een deelnamecertificaat van Tridata. Na afloop kunnen de deelnemers eveneens deelnemen aan het INFORMS examen voor de internationaal erkende titel Certified Analytics Professional (CAP). De daaraan verbonden kosten komen voor de rekening van de deelnemer.
*N.B. Voor CAP certificering is minimaal 3 jaar relevante werkervaring vereist.

Cursuslocatie Utrecht

Europalaan 400, 5e verdieping
3526 KS Utrecht

In-company en maatwerk

De Opleiding Data Science en Big Data Analytics kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die binnen jouw organisatie plaatsvindt. Hebben meerdere collega’s in jouw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s. Voor meer informatie kunt u contact met ons opnemen.

Een selectie van de organisaties die gekozen hebben voor in-company en maatwerk opleidingen: CentERdata, UWV, Gemeente Lelystad, Nederlandsche Bank,  Inspectie van het Onderwijs, Inspectie Sociale Zaken en Werkgelegenheid, Inspectie Leefomgeving en Transport. Autoriteit Nucleaire Veiligheid en Stralingsbescherming, Erfgoedinspectie, Inspectie Gezondheidszorg en Jeugd, Staatstoezicht op de Mijnen, Inspectie Justitie en Veiligheid, Inspectie Gezondheidszorg en Jeugd, Algemene Rekenkamer, Nederlandse Voedsel- en Warenautoriteit.

Waarom de opleiding volgen bij Tridata?

– Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– Tridata is het eerste instituut in Nederland dat begonnen is met het verzorgen van datascienceopleidingen.
– De Opleiding Data Science van Tridata is een multidisciplinaire opleiding die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, big data, tekstmining, datavisualisatie en datamanagement & cloud computing. De docenten hebben diverse wetenschappelijke artikelen gepubliceerd in boeken en tijdschriften. Ook hebben zij talloze R packages geschreven en gepubliceerd. Zij beschikken over aantoonbare didactische vaardigheden.

Docenten

Dr. Mark van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Sinds zijn promotie op een onderwerp uit de quantumfysica is hij werkzaam als statistisch onderzoeker bij het CBS, met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, Python,  en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipediapagina’s. Mark werkt sinds 2012 als consultant en docent voor Tridata.

Drs. Edwin de Jonge studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren te hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS, met als specialiteit statistical computing and modeling, datamanagement en datavisualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert op het gebied van verschillende programmeertalen waaronder C++, Javascript, Python en R. In die laatste taal ontwikkelde hij een package dat inmiddels meer dan 120.000 maal per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.

Mark van der Loo en Edwin de Jonge zijn auteurs van de boeken “Learning RStudio for R Statistical Computing” (Packt Publishing, 2012) en “Statistical Data Cleaning with Applications in R” (Wiley, 2018). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) getiteld “An introduction to data cleaning with R”. Zij waren ook keynote speakers op useR conferenties in Boekarest, Los Angeles, Toulouse, Marrakesh, Madrid, etc.

Dr. K. (Karin) Groothuis-Oudshoorn, is an Assistant Professor and Biostatistician at University of Twente, the Netherlands. Dr. Groothuis-Oudshoorn completed her PhD at the University of Utrecht, specializing in mathematical statistics. After that she worked at several applied research institutes as a (bio)statistician. In 2009, she joined the department of Health Technology and Services Research at the University of Twente where her research focus is on survival regression models, statistical learning and design and statistical analysis of preferences. She teaches courses on data science, statistical learning and medical statistics for several educational programs at the University of Twente. Next to that she is working since 2011 as a statistical consultant and teacher for Tridata.

Dr. J.(Joris) de Wind promoveerde in 2014 aan de Universiteit van Amsterdam (Cum Laude). In zijn proefschrift heeft hij verschillende nieuwe econometrische technieken ontwikkeld en toegepast op macro-economische vraagstukken. Joris heeft in de periode 2008-2017 verschillende economische modellen ontwikkeld voor beleidsanalyses en voor het maken van (kortetermijn)voorspellingen, eerst bij De Nederlandsche Bank en later bij het Centraal Planbureau. In 2017 heeft Joris de overstap gemaakt naar de datasciencediscipline en is momenteel als data scientist werkzaam bij ING Nederland. Sinds medio 2018 geeft Joris diverse cursussen over data science namens Tridata, zowel in R en ook met Python.

Dr. ir. J.(Jan) van der Laan studeerde af op het gebied van signaalverwerking bij de de faculteit technische natuurkunde aan de Technische Universiteit Delft. Na zijn promotie op het gebied van medical physics is hij als statistisch onderzoeker werkzaam bij het CBS. Op het CBS houdt hij zich onder andere bezig met statistische analyse en regressietechnieken, datavisualisatie en het verwerken en koppelen van grote bestanden. Over deze onderwerken publiceert hij op conferenties en in peer reviewed journals. Jan is expert op het gebied van  meerdere programmeertalen waaronder C++, Javascript, D3.js en R. Hij heeft bijdragen geleverd aan meerdere R packages op CRAN en werkt sinds 2015 als consultant en docent bij Tridata.

Blijf op de hoogte van nieuwe ervaringen

Er zijn nog geen ervaringen.

Deel je ervaring

Heb je ervaring met deze cursus? Deel je ervaring en help anderen kiezen. Als dank voor de moeite doneert Springest € 1,- aan Stichting Edukans.

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Download gratis en vrijblijvend de informatiebrochure

(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)

Heb je nog vragen?

(optioneel)

Aanmelden voor nieuwsbrief

We slaan je gegevens op om je via e-mail en evt. telefoon verder te helpen.
Meer info vind je in ons privacybeleid.