Data Science op de Command Line

Niveau
Tijdsduur
Trainer
Jeroen Janssens
Logo van Data Science Workshops B.V.
Opleiderscore: starstarstarstarstar 9,5 Data Science Workshops B.V. heeft een gemiddelde beoordeling van 9,5 (uit 50 ervaringen)
Beste opleider van Nederland

Winnaar Beste opleider van Nederland 2020: #2 beste trainer.

Lees meer over Beste Opleider van Nederland 2020.

Tip: meer info over het programma, prijs, en inschrijven? Download de brochure!

9,5
Gemiddeld cijfer voor Data Science op de Command Line
Gebaseerd op 15 ervaringen Lees alle ervaringenchevron_right
starstarstarstarstar_half
Eriks Kopass
Product Owner
9
Data Science op de Command Line

"Great training, learned some new command-line tools that shall be useful to utilize in work scenarios. Thanks to Jeroen for being prepared, to-the-point and explaining the stuff for the students with different backgrounds." - 09-12-2020 16:01

"Great training, learned some new command-line tools that shall be useful to utilize in work scenarios. Thanks to Jeroen for being prepared, … alles lezen - 09-12-2020 16:01

Startdata en plaatsen

Er zijn nog geen startdata bekend voor dit product.

Data Science Workshops B.V. biedt haar producten standaard aan in de volgende regio's: 's-Hertogenbosch, Alkmaar, Almere / Lelystad, Alphen aan den Rijn, Amersfoort, Amsterdam, Antwerpen, Apeldoorn, Arnhem, Assen, Breda, Brugge, Brussel, Delft, Den Haag, Deventer, Dordrecht, Drachten, Ede, Eindhoven, Emmen, Enschede, Gent, Gouda, Groningen, Haarlem, Haarlemmermeer, Heerenveen, Hilversum, Leeuwarden, Leiden, Luik, Maastricht, Middelburg, Nijmegen, Roermond, Rotterdam, Terneuzen, Tilburg, Utrecht, Veenendaal, Venlo, Westland, Zaanstad, Zoetermeer, Zwolle

Beschrijving

Introductie

De unix command line, hoewel decennia geleden uitgevonden, is een geweldige omgeving voor het efficient uitvoeren van essentiele data scinece taken. Door kleine, krachtige tools (zoals parallel, jq en csvkit) te combineren, kun je snel jouw data opschonen en verkennen.

Deze hands-on workshop is gebaseerd op het O'Reilly boek Data Science at the Command Line, geschreven door instructeur Jeroen Janssens. Je leert hoe je snelle data pijplijnen bouwt, hoe je R en Python gebruikt op de command line en hoe je snel data visualiseert. Er is geen voorkennis over unix vereist.

Aan het einde van deze workshop heb je een goed begrip van hoe je de command line kunt integreren in je data scien…

Lees de volledige beschrijving

Veelgestelde vragen

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Nog niet gevonden wat je zocht? Bekijk deze onderwerpen: Shell scripting, Data Science, Linux, Unix en iOS.

Introductie

De unix command line, hoewel decennia geleden uitgevonden, is een geweldige omgeving voor het efficient uitvoeren van essentiele data scinece taken. Door kleine, krachtige tools (zoals parallel, jq en csvkit) te combineren, kun je snel jouw data opschonen en verkennen.

Deze hands-on workshop is gebaseerd op het O'Reilly boek Data Science at the Command Line, geschreven door instructeur Jeroen Janssens. Je leert hoe je snelle data pijplijnen bouwt, hoe je R en Python gebruikt op de command line en hoe je snel data visualiseert. Er is geen voorkennis over unix vereist.

Aan het einde van deze workshop heb je een goed begrip van hoe je de command line kunt integreren in je data science-workflow. Zelfs als je al vertrouwd bent met het verwerken van data met bijvoorbeeld R of Python, zal het kunnen gebruiken van de kracht van de opdrachtregel je een effectievere en efficientere datawetenschapper maken.

Leerdoelen

  • Taken automatiseren
  • Taken paralleliseren en distribueren over meerdere cores en machines
  • Converteer jouw bestaande code naar herbruikbare command line tools
  • Eenvoudig dataset inspecteren, transformeren en visualiseren
  • Pas een verscheidenheid aan gecontroleerde en niet-gesuperviseerde algoritmen voor machine learning toe

Programma

Dag 1:

  • Inleiding
    • Wat is de command line?
    • Waarom de command line leren voor het doen van data science?
    • Een praktijkvoorbeeld van data science
    • Aan de slag met de Docker image
  • Essentiele concepten van de Unix command line
    • Tools uitvoeren
    • Tools combineren
    • Omleiden van invoer en uitvoer
    • Werken met bestanden
    • Hulp krijgen
  • Data verkrijgen uit logboeken, spreadsheets en databases
  • Data downloaden van internet en toegang krijgen tot API's met behulp van curl
  • Data transformeren met filters zoals cut, paste, grep en sed
  • Efficient verwerken van andere data formaten
    • JSON met jq
    • CSV met csvkit
    • HTML met pup
    • XML met xmlstarlet

Dag 2:

  • R uitvoeren vanaf de opdrachtregel
  • Visualiseren van gegevens vanaf de opdrachtregel
    • Scatterplot
    • Histogram
    • Staafdiagram
    • Geografische visualisatie
  • Parallelliseren en distribueren van data-intensieve pijplijnen
  • Herbruikbare tools maken
    • Automatiseer taken in een Bash-script
    • Converteer jouw bestaande code naar een command-line tool
    • Argumenten verwerken
    • Werken met streaming data
  • Machine learning toepassen
    • Dimensionaliteitsreductie
    • Classificatie
    • Regressie
  • Conclusie

Voorbereiding

Deelnemers wordt vriendelijk verzocht om voor aanvang van de workshop de volgende zaken te installeren:

  • Docker Desktop voor Windows of voor macOS of voor Ubuntu
  • De Docker image, door uit te voeren: docker pull datasciencetoolbox/dsatcl2e

Klanten

Ik heb eerder deze workshop verzorgd voor:

  • Accenture
  • Amazon
  • Container Solutions
  • Prezi
  • Rabobank
  • SURFnet
  • Snow
  • Social Point
  • Teradata
  • The New York Times

Recensies

"Great workshop! Very well done and very useful information delivered in an excellent and interactive manner. Jeroen anticipated very well on the different knowledge levels within the group. I would highly recommend the Data Science at the Command Line workshop to anyone that is interested in either kickstarting their command-line experiences or improving their data science with Unix power tools."

--Sanne Bouwman, Data Scientist, Teradata

"As a seasoned UNIX command line adept, I didn’t expect to learn much from a Data Science at the Command Line workshop. I was wrong! Over the years, many new tools have become available that I didn’t know about, and that can be combined with traditional tools in new ways.

Since attending the workshop, I have been able to simplify and improve the efficiency of many of the scripts I use on a daily basis. Recommended for anyone working from the command line, newbies and ninjas alike!"

--Joost van Dijk, Manager Middleware Services, SURFnet

"Besides demonstrating a good knowledge and experience in command-line tools for data science, the instructor had very good training skills, clear communication, and managed to adapt the level of the training to the level of the audience, which is not always easy!"

--Marc Canaleta, CTO, Social Point

9,5
Gemiddeld cijfer voor Data Science op de Command Line
Gebaseerd op 15 ervaringen
starstarstarstarstar_half
Eriks Kopass
Product Owner
9
Data Science op de Command Line

"Great training, learned some new command-line tools that shall be useful to utilize in work scenarios. Thanks to Jeroen for being prepared, to-the-point and explaining the stuff for the students with different backgrounds." - 09-12-2020 16:01

"Great training, learned some new command-line tools that shall be useful to utilize in work scenarios. Thanks to Jeroen for being prepared, … alles lezen - 09-12-2020 16:01

Evance Soumaoro
starstarstarstarstar_half
Evance Soumaoro
Senior Software Developer
9
Data Science op de Command Line

"This training was very enlightening. I discovered that most of our tasks could be achieved using simple tools, without the need for heavyweight & complex software. This training not only got me data science skills with simple tools, but I also felt very confident as a command-line power user." - 10-11-2020 09:41

"This training was very enlightening. I discovered that most of our tasks could be achieved using simple tools, without the need for heavywei… alles lezen - 10-11-2020 09:41

starstarstarstarstar
marton hubay
10
Data Science op de Command Line

"By the end of the course, you are going to understand how to not overengineer certain tasks, how you can use simple shell commands to tackle problems that often come up in the field of data engineering, data science, and system engineering. I can highly recommend the trainer." - 09-11-2020 20:13

"By the end of the course, you are going to understand how to not overengineer certain tasks, how you can use simple shell commands to tackle… alles lezen - 09-11-2020 20:13

starstarstarstarstar_half
Steve
Data scientis
9
Data Science op de Command Line

"De cursus is voor mij een goede start geweest om in brede zin aan de slag te gaan met de command line. Wat ik prettig vond is dat er veel interactie was en ruimte voor suggesties wat betreft de inhoud van de cursus. " - 09-11-2020 15:37

"De cursus is voor mij een goede start geweest om in brede zin aan de slag te gaan met de command line. Wat ik prettig vond is dat er veel in… alles lezen - 09-11-2020 15:37

Jorg Rødsjø
starstarstarstarstar
Jorg Rødsjø
10
Data Science op de Command Line

"I took the class in 2016, and really liked it. When I returned home, I could put jq to use in a very effective way. This saved us a ton of time processing large data-sets. Jeroen was also very gracious and helped me with some problems I encountered after the works. Definitely recommended for anyone who needs to up their command line skills for crunching data. " - 09-11-2020 13:48

"I took the class in 2016, and really liked it. When I returned home, I could put jq to use in a very effective way. This saved us a ton of t… alles lezen - 09-11-2020 13:48

Gerben Venekamp
starstarstarstarstar
Gerben Venekamp
Adviseur bij SURF
10
Data Science op de Command Line

"Erg leuke, maar ook vooral inzichtelijke cursus. Hoewel ik zelf al aardig bedreven ben op de command line, heb ik toch nog een paar handige dingen weten te leren. Met de kundigheid van de trainer zit het wel snor. Ook was zijn uitleg duidelijk en prima te volgen en was er vol op gelegenheid voor het stellen van vragen. Daarnaast was er ook genoeg ruimte om zelf aan de slag te gaan en eigenhandig het e.e.a. uit te proberen. De cursus was in-house gegeven en dus daarmee een prima locatie. Mooi om te zien wat je allemaal op de command line, en dus scripting, kan doen." - 06-11-2020 07:59

"Erg leuke, maar ook vooral inzichtelijke cursus. Hoewel ik zelf al aardig bedreven ben op de command line, heb ik toch nog een paar handige … alles lezen - 06-11-2020 07:59

Anastasia Khomenko
starstarstarstarstar_half
Anastasia Khomenko
Data Scientist
9
Data Science op de Command Line

"Ik vond de training makkelijk te volgen, heel veel nuttige informatie. Ik vond het ook echt leuk dat de trainer was altijd klaar om workshop aan te passen voor ons. Dus wij kon zeggen wat wij wel of niet wilden leren en hij voorbereidde materialen.
Nu heb ik zeker wat meer kennis over de topic en ik kan het in mijn werk toepassen." - 04-11-2020 14:32

"Ik vond de training makkelijk te volgen, heel veel nuttige informatie. Ik vond het ook echt leuk dat de trainer was altijd klaar om workshop… alles lezen - 04-11-2020 14:32

starstarstarstarstar
Alessandro Ausenda
Data analyst
10
Data Science op de Command Line

"Jeroen gave a python workshop at the company I am working for and it was simply perfect. Got all the valuable information needed to get better and better a Python. Jeroen was also teaching R classes at the Tilburg University, I attended his classes and I can only suggest him as an extremely prepared instructor." - 04-11-2020 09:41

"Jeroen gave a python workshop at the company I am working for and it was simply perfect. Got all the valuable information needed to get bett… alles lezen - 04-11-2020 09:41

starstarstarstarstar_half
Lennard van Wanrooij
Data Scientist
9
Data Science op de Command Line

"Erg interessante cursus en het was duidelijk dat Jeroen erg goed in de inhoud zat. Ook kon hij flexibel ingaan op vragen vanuit de cursisten, waardoor de cursus meerdere richtingen op kon gaan, maar er bleef altijd een rode draad. Goede afwisseling van theorie en zelf praktisch aan de slag. Vanwege coronatijden was de cursus (helaas) volledig digitaal, maar Jeroen had hier een goede setup voor gekozen." - 04-11-2020 06:15

"Erg interessante cursus en het was duidelijk dat Jeroen erg goed in de inhoud zat. Ook kon hij flexibel ingaan op vragen vanuit de cursisten… alles lezen - 04-11-2020 06:15

starstarstarstarstar_half
André Klaver
9
Data Science op de Command Line

"Excellent workshop for both beginners (which I consider myself to be) and advanced users. The course was well prepared with docker images and working with the API of IMDB from the command line was as much fun as it was educational. " - 03-11-2020 16:27

"Excellent workshop for both beginners (which I consider myself to be) and advanced users. The course was well prepared with docker images an… alles lezen - 03-11-2020 16:27

starstarstarstarstar_half
Kees de Kievith
IT analyst
9
Data Science op de Command Line

"De cursus van Jeroen geeft een goed overzicht hoe je de command line kan gebruiken voor data science. Als een niet dagelijks gebruiker van unix/Linux was de cursus voor mij heel goed te volgen en door de vele praktische voorbeelden erg leuk om deel te nemen. Jeroen geeft tijdens de workshop ook de mogelijk om zelf een praktijk voorbeeld voor te leggen. " - 03-11-2020 11:08

"De cursus van Jeroen geeft een goed overzicht hoe je de command line kan gebruiken voor data science. Als een niet dagelijks gebruiker van u… alles lezen - 03-11-2020 11:08

starstarstarstarstar
Joost Helberg
CEO, Snow
10
Data Science op de Command Line

"Data Science Workshops was able to skillfully differentiate, addressing various Unix Consultants at Snow with very different skill sets. The instructor, Jeroen Janssens, made some people really rise above themselves." - 31-10-2020 12:22

"Data Science Workshops was able to skillfully differentiate, addressing various Unix Consultants at Snow with very different skill sets. The… alles lezen - 31-10-2020 12:22

starstarstarstarstar
Marc Canaleta
CTO, Social Point
10
Data Science op de Command Line

"Besides demonstrating a good knowledge and experience in command-line tools for data science, Jeroen had very good training skills, clear communication, and managed to adapt the level of the training to the level of the audience, which is not always easy!" - 15-09-2020 12:00

"Besides demonstrating a good knowledge and experience in command-line tools for data science, Jeroen had very good training skills, clear co… alles lezen - 15-09-2020 12:00

starstarstarstarstar
Sanne Bouwman
Data Scientist
10
Data Science op de Command Line

"Great workshop! Very well done and very useful information delivered in an excellent and interactive manner. Jeroen anticipated very well on the different knowledge levels within the group. I would highly recommend the Data Science at the Command Line workshop to anyone that is interested in either kickstarting their command-line experiences or improving their data science with Unix power tools." - 11-09-2020 17:51

"Great workshop! Very well done and very useful information delivered in an excellent and interactive manner. Jeroen anticipated very well on… alles lezen - 11-09-2020 17:51

starstarstarstarstar
Joost van Dijk
Manager Middleware Services, SURFnet
10
Data Science op de Command Line

"As a seasoned UNIX command line adept, I didn’t expect to learn much from a Data Science at the Command Line workshop. I was wrong! Over the years, many new tools have become available that I didn’t know about, and that can be combined with traditional tools in new ways.

Since attending the workshop, I have been able to simplify and improve the efficiency of many of the scripts I use on a daily basis. Recommended for anyone working from the command line, newbies and ninjas alike!" - 20-07-2020 09:52

"As a seasoned UNIX command line adept, I didn’t expect to learn much from a Data Science at the Command Line workshop. I was wrong! Over the… alles lezen - 20-07-2020 09:52

Jeroen Janssens - Principal Instructor
Jeroen Janssens
Principal Instructor
9,5

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Download gratis en vrijblijvend de informatiebrochure

Aanhef
(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)

Heb je nog vragen?

(optioneel)
We slaan je gegevens op om je via e-mail en evt. telefoon verder te helpen.
Meer info vind je in ons privacybeleid.