Transform data with pySpark dataframes
placeVirtual 10 feb. 2026 tot 11 feb. 2026check_circle Startgarantie Toon roosterevent 10 februari 2026, 09:00-17:00, Virtual, Dag 1
event 11 februari 2026, 09:00-17:00, Virtual, Dag 2
|
placeStartel (Drachten) 19 feb. 2026 tot 20 feb. 2026Toon rooster event 19 februari 2026, 09:00-17:00, Startel (Drachten), Dag 1
event 20 februari 2026, 09:00-17:00, Startel (Drachten), Dag 2
|
placeStartel (Drachten) 22 apr. 2026 tot 23 apr. 2026Toon rooster event 22 april 2026, 09:00-17:00, Startel (Drachten), Dag 1
event 23 april 2026, 09:00-17:00, Startel (Drachten), Dag 2
|
placeVirtual 28 apr. 2026 tot 29 apr. 2026Toon rooster event 28 april 2026, 09:00-17:00, Virtual, Dag 1
event 29 april 2026, 09:00-17:00, Virtual, Dag 2
|
placeStartel (Drachten) 24 jun. 2026 tot 25 jun. 2026Toon rooster event 24 juni 2026, 09:00-17:00, Startel (Drachten), Dag 1
event 25 juni 2026, 09:00-17:00, Startel (Drachten), Dag 2
|
placeVirtual 30 jun. 2026 tot 1 jul. 2026Toon rooster event 30 juni 2026, 09:00-17:00, Virtual, Dag 1
event 1 juli 2026, 09:00-17:00, Virtual, Dag 2
|
Startel in Drachten verzorgt al ruim 25 jaar IT-opleidingen in Nederland en België.
Over de Transform data - pySpark dataframes
In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.
Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aans…

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
Startel in Drachten verzorgt al ruim 25 jaar IT-opleidingen in Nederland en België.
Over de Transform data - pySpark dataframes
In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.
Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aansluit op jouw analyses.
Na de transformatie van jouw data zul je in de training Transform data with pySpark dataframes zien hoe jij deze weg kunt schrijven naar de gewenste locatie. Of het nu voor rapportages, dashboards of andere toepassingen bedoeld is, jij hebt de vrijheid om data precies op te slaan daar waar het nodig is.
Voor wie is deze pySpark dataframes training?
De training Transform data with pySpark dataframes is geschikt voor iedereen die Spark wil gebruiken om datamanipulaties uit te voeren.
Dit betreft met name de volgende mensen:
- Microsoft Fabric-gebruikers.
- Data-analisten.
- Data engineers.
- Data scientists (datawetenschappers).
- Mensen met vergelijkbare functies binnen het vakgebied van datawetenschap en -analyse.
Leerdoelen van deze pySpark training
Door de training Transform data with pySpark dataframes te volgen, zul je de volgende kennis en vaardigheden verkrijgen:
- Dataframes aanmaken op basis van verschillende bronnen.
- Data koppelen, filteren, aggregeren en op andere wijze transformeren.
- Werken met delta-tabellen.
- Data binnen Data Lakes partitioneren.
Aanbevolen voorkennis pySpark dataframes
Voordat je deelneemt aan de training Transform data with pySpark dataframes, raden wij aan dat jij beschikt over enige kennis van de programmeertalen Python en SQL, echter is dit niet verplicht.
Onderwerpen van deze pySpark training
In de training Transform data with pySpark dataframes, zullen de volgende onderwerpen aan bod komen:
- Inleiding op Spark.
- Data lezen.
- Dataframes creëren.
- CSV, JSON, SQL table.
- Schema.
- Data transformeren.
- Kolommen selecteren.
- Berekende kolommen toevoegen.
- Kolommen selecteren.
- Rijen filteren.
- Join.
- Groeperen.
- Ranking en windowing.
- SQL gebruiken.
- Naar bestanden en tabellen schrijven.
- Partition by.
- Werken met delta-tabellen.
- Optimaliseren.
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
