Transform data with pySpark dataframes

Tijdsduur
Locatie
Op locatie
Startdatum en plaats

Transform data with pySpark dataframes

Startel bv
Logo van Startel bv
Opleiderscore: starstarstarstarstar_half 9,2 Startel bv heeft een gemiddelde beoordeling van 9,2 (uit 191 ervaringen)

Tip: meer info over het programma, prijs, en inschrijven? Download de brochure!

Startdata en plaatsen
placeVirtual
10 feb. 2026 tot 11 feb. 2026
check_circle Startgarantie
Toon rooster
event 10 februari 2026, 09:00-17:00, Virtual, Dag 1
event 11 februari 2026, 09:00-17:00, Virtual, Dag 2
placeStartel (Drachten)
19 feb. 2026 tot 20 feb. 2026
Toon rooster
event 19 februari 2026, 09:00-17:00, Startel (Drachten), Dag 1
event 20 februari 2026, 09:00-17:00, Startel (Drachten), Dag 2
placeStartel (Drachten)
22 apr. 2026 tot 23 apr. 2026
Toon rooster
event 22 april 2026, 09:00-17:00, Startel (Drachten), Dag 1
event 23 april 2026, 09:00-17:00, Startel (Drachten), Dag 2
placeVirtual
28 apr. 2026 tot 29 apr. 2026
Toon rooster
event 28 april 2026, 09:00-17:00, Virtual, Dag 1
event 29 april 2026, 09:00-17:00, Virtual, Dag 2
placeStartel (Drachten)
24 jun. 2026 tot 25 jun. 2026
Toon rooster
event 24 juni 2026, 09:00-17:00, Startel (Drachten), Dag 1
event 25 juni 2026, 09:00-17:00, Startel (Drachten), Dag 2
placeVirtual
30 jun. 2026 tot 1 jul. 2026
Toon rooster
event 30 juni 2026, 09:00-17:00, Virtual, Dag 1
event 1 juli 2026, 09:00-17:00, Virtual, Dag 2
Beschrijving

Startel in Drachten verzorgt al ruim 25 jaar IT-opleidingen in Nederland en België. 

Over de Transform data - pySpark dataframes

In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.

Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aans…

Lees de volledige beschrijving

Veelgestelde vragen

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Nog niet gevonden wat je zocht? Bekijk deze onderwerpen: Data Analyse, Microsoft Azure, Big Data, Datavisualisatie en Data Science.

Startel in Drachten verzorgt al ruim 25 jaar IT-opleidingen in Nederland en België. 

Over de Transform data - pySpark dataframes

In de training Transform data with pySpark dataframes leer je hoe jij Python in kunt zetten op Spark clusters (zoals pySpark) voor het implementeren van dataplatformen. Door te werken met Databricks, Microsoft Synapse Spark pools en Microsoft Fabric Spark pools, zul je ontdekken hoe jij op schaal data klaar kunt stomen voor diverse toepassingen.

Verder leer je in de cursus Transform data with pySpark dataframes hoe jij Spark DataFrames kunt maken op basis van databestanden die lokaal of in een Data Lake opgeslagen zijn. Vervolgens pas je transformaties toe om de ingelezen data precies zodanig aan te passen als je nodig hebt, zodat het helemaal aansluit op jouw analyses.

Na de transformatie van jouw data zul je in de training Transform data with pySpark dataframes zien hoe jij deze weg kunt schrijven naar de gewenste locatie. Of het nu voor rapportages, dashboards of andere toepassingen bedoeld is, jij hebt de vrijheid om data precies op te slaan daar waar het nodig is.

Voor wie is deze pySpark dataframes training?

De training Transform data with pySpark dataframes is geschikt voor iedereen die Spark wil gebruiken om datamanipulaties uit te voeren.

Dit betreft met name de volgende mensen:

  • Microsoft Fabric-gebruikers.
  • Data-analisten.
  • Data engineers.
  • Data scientists (datawetenschappers).
  • Mensen met vergelijkbare functies binnen het vakgebied van datawetenschap en -analyse.

Leerdoelen van deze pySpark training

Door de training Transform data with pySpark dataframes te volgen, zul je de volgende kennis en vaardigheden verkrijgen:

  • Dataframes aanmaken op basis van verschillende bronnen.
  • Data koppelen, filteren, aggregeren en op andere wijze transformeren.
  • Werken met delta-tabellen.
  • Data binnen Data Lakes partitioneren.

Aanbevolen voorkennis pySpark dataframes

Voordat je deelneemt aan de training Transform data with pySpark dataframes, raden wij aan dat jij beschikt over enige kennis van de programmeertalen Python en SQL, echter is dit niet verplicht.

Onderwerpen van deze pySpark training

In de training Transform data with pySpark dataframes, zullen de volgende onderwerpen aan bod komen:

  • Inleiding op Spark.
  • Data lezen.
    • Dataframes creëren.
    • CSV, JSON, SQL table.
    • Schema.
  • Data transformeren.
    • Kolommen selecteren.
      • Berekende kolommen toevoegen.
  • Rijen filteren.
  • Join.
  • Groeperen.
    • Ranking en windowing.
  • SQL gebruiken.
  • Naar bestanden en tabellen schrijven.
  • Partition by.
  • Werken met delta-tabellen.
  • Optimaliseren.
Blijf op de hoogte van nieuwe ervaringen
Er zijn nog geen ervaringen.
Deel je ervaring
Heb je ervaring met deze cursus? Deel je ervaring en help anderen kiezen. Als dank voor de moeite doneert Springest € 1,- aan Stichting Edukans.

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Download gratis en vrijblijvend de informatiebrochure

(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)

Heb je nog vragen?

(optioneel)

Aanmelden voor nieuwsbrief

We slaan je gegevens op om je via e-mail en evt. telefoon verder te helpen.
Meer info vind je in ons privacybeleid.