Big Data Hadoop and Spark Developer eLearning

Type product
Logo van Adding Value Consulting (AVC)
Opleiderscore: starstarstarstarstar 9,8 Adding Value Consulting (AVC) heeft een gemiddelde beoordeling van 9,8 (uit 19 ervaringen)

Tip: meer info over het programma, prijs, en inschrijven? Download de brochure!

Beschrijving

Big Data Hadoop and Spark Developer eLearning

Leer hoe u grote hoeveelheden gegevens kunt analyseren

De wereld wordt steeds digitaler en het belang van big data en data-analyse zal de komende jaren alleen maar toenemen. Het kiezen van een carrière op het gebied van big data en analytics is misschien wel wat je zoekt om aan je carrièreverwachtingen te voldoen.

De Big Data Hadoop-training leert je de concepten van het Hadoop-framework, de vorming ervan in een clusteromgeving, en bereidt je voor op Cloudera's CCA175 Big Data-certificering die niet bij deze training is inbegrepen.

OVER DE CURSUS

Met deze Big Data Hadoop-cursus leer je het big data-framework met Hadoop en Spark, inclusief HD…

Lees de volledige beschrijving

Veelgestelde vragen

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Nog niet gevonden wat je zocht? Bekijk deze onderwerpen: Apache Hadoop, Big Data, Data warehouse, Apache en Data mining.

Big Data Hadoop and Spark Developer eLearning

Leer hoe u grote hoeveelheden gegevens kunt analyseren

De wereld wordt steeds digitaler en het belang van big data en data-analyse zal de komende jaren alleen maar toenemen. Het kiezen van een carrière op het gebied van big data en analytics is misschien wel wat je zoekt om aan je carrièreverwachtingen te voldoen.

De Big Data Hadoop-training leert je de concepten van het Hadoop-framework, de vorming ervan in een clusteromgeving, en bereidt je voor op Cloudera's CCA175 Big Data-certificering die niet bij deze training is inbegrepen.

OVER DE CURSUS

Met deze Big Data Hadoop-cursus leer je het big data-framework met Hadoop en Spark, inclusief HDFS, YARN en MapReduce. De cursus behandelt ook Pig, Hive en Impala voor het verwerken en analyseren van grote datasets die zijn opgeslagen in de HDFS en het gebruik van Sqoop en Flume voor data-opname.

Je krijgt realtime gegevensverwerking te zien met behulp van Spark, inclusief functioneel programmeren in Spark, het implementeren van Spark-applicaties, inzicht in parallelle verwerking in Spark en het gebruik van Spark RDD-optimalisatietechnieken. Je leert ook de verschillende interactieve algoritmen in Spark en gebruikt Spark SQL voor het maken, transformeren en opvragen van gegevensformulieren.

Ten slotte moet u real-life, branchegerichte projecten uitvoeren met CloudLab op het gebied van bankieren, telecommunicatie, sociale media, verzekeringen en e-commerce.

VEREISTEN

Er zijn geen voorwaarden voor deze cursus. Het is echter handig om enige kennis te hebben van Core Java en SQL. We bieden een gratis online cursus "Java essentials for Hadoop" in je eigen tempo aan als je je Core Java-vaardigheden wilt opfrissen.

LEERDOELEN

Aan het einde van de cursus begrijpt u:

  • De verschillende componenten van het Hadoop-ecosysteem, zoals Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume en Apache Spark
  • Hadoop Distributed File System (HDFS) en YARN-architectuur
  • MapReduce en zijn kenmerken en assimileer geavanceerde MapReduce-concepten
  • Verschillende soorten bestandsindelingen, Avro-schema, Avro met Hive en Sqoop en Schema-evolutie
  • Goot, gootarchitectuur, bronnen, gootputten, kanalen en gootconfiguraties
  • HBase, de architectuur en gegevensopslag, en leer het verschil tussen HBase en RDBMS
  • Veerkrachtige distributiedatasets (RDD) in detail
  • De algemene use-cases van Spark en verschillende interactieve algoritmen

U kunt ook:

  • Gegevens opnemen met Sqoop en Flume
  • Maak een database en tabellen in Hive en Impala, begrijp HBase en gebruik Hive en Impala voor partitionering
  • Praktische kennis opdoen van Pig en zijn componenten
  • Programmeer functioneel in Spark, en implementeer en bouw Spark-applicaties
  • Een diepgaand inzicht verwerven in parallelle verwerking in Spark en Spark RDD-optimalisatietechnieken
  • Dataframes maken, transformeren en opvragen met Spark SQL

WAT IS INBEGREPEN

  • 12 maanden online toegang tot de Big data hadoop en e-learning voor ontwikkelaars
  • Ongeveer 25 uur duur
  • Vijf praktische projecten om de geleerde vaardigheden te perfectioneren
  • Twee simulatietestpapieren voor zelfevaluatie
  • 16 lessen
  • Gratis cursus inbegrepen - Apache Kafka
  • Gratis cursus inbegrepen - Core Java
  • 5 real-life industrieprojecten

De behandelde onderwerpen

De cursus behandelt de volgende onderwerpen:

  • Cursus Inleiding
  • Les 1 - Inleiding tot big data en het Hadoop-ecosysteem
  • Les 2 - HDFS en YARN
  • Les 3 - MapReduce en Sqoop
  • Les 4 - Basisprincipes van Hive en Impala
  • Les 5 - Werken met Hive en Impala
  • Les 6 - Soorten gegevensformaten
  • Les 7 - Geavanceerd Hive-concept en partitionering van gegevensbestanden
  • Les 8 - Apache Flume en HBase
  • Les 9 - Varken
  • Les 10 - Basisprincipes van Apache Spark
  • Les 11 - RDD's in Spark
  • Les 12 - Implementatie van Spark-applicaties
  • Les 13 - Spark parallelle verwerking
  • Les 14 - Spark RDD-optimalisatietechnieken
  • Les 15 - Spark-algoritme
  • Les 16 - Spark SQL
  • GRATIS CURSUS - Apache Kafka
  • GRATIS CURSUS - Core Java

De training omvat ook vijf real-life, branchegerichte projecten. Succesvolle evaluatie van een van de eerste twee onderstaande projecten maakt deel uit van de criteria om in aanmerking te komen voor certificering. We hebben ook drie extra projecten toegevoegd om te oefenen, om u te helpen bij het starten van uw Hadoop- en Spark-reis.

Project 1

Domein: Bankieren - een Portugese bankinstelling voerde een marketingcampagne om potentiële klanten te overtuigen om te investeren in een termijndeposito. Hun marketingcampagnes werden gevoerd via telefoongesprekken en sommige klanten werden meer dan eens benaderd. Het is jouw taak om de gegevens die tijdens de marketingcampagne zijn verzameld, te analyseren.

Project 2

Domein: Telecommunicatie - een aanbieder van mobiele telefonie heeft een nieuwe Open Network-campagne gelanceerd. Het bedrijf heeft gebruikers uitgenodigd om klachten in te dienen over de torens in hun omgeving als ze problemen ondervinden met hun mobiele netwerk. Het bedrijf heeft de dataset verzameld van gebruikers die een klacht hebben ingediend. Het vierde en vijfde veld van de dataset hebben een lengte- en breedtegraad van gebruikers, wat belangrijke informatie is voor het bedrijf. U moet deze lengte- en breedtegegevens vinden op basis van de beschikbare dataset en drie clusters van gebruikers maken met een k-gemiddeldenalgoritme.

Project 3

Domein: sociale media - als onderdeel van een rekruteringsoefening vroeg een groot bedrijf voor sociale media kandidaten om een ​​dataset van Stack Exchange te analyseren. U gaat de dataset gebruiken om tot bepaalde belangrijke inzichten te komen.

Project 4

Domein: website met filmgerelateerde informatie - IMDB is een online database met filmgerelateerde informatie. IMDB-gebruikers beoordelen films op een schaal van 1 tot 5 - waarbij 1 de slechtste en 5 de beste is - en beoordelingen geven. De dataset bevat ook aanvullende informatie, zoals het jaar van uitgave van de film. Je hebt de taak om de verzamelde gegevens te analyseren.

Project 5

Domein: Verzekering - een in de VS gevestigde verzekeringsmaatschappij heeft besloten een nieuw ziektekostenverzekeringsprogramma te lanceren dat gericht is op verschillende klanten. Om een ​​klant te helpen de markt beter te begrijpen, moet u een reeks gegevensanalyses uitvoeren met Hadoop.

DOELGROEP

Carrièremogelijkheden op het gebied van big data nemen toe en Hadoop wordt snel een technologie die je moet kennen in de big data-architectuur. Big Data-training is geschikt voor IT-, datamanagement- en analyseprofessionals, waaronder:

  • Softwareontwikkelaars en architecten
  • Analytics-professionals
  • Senior IT-professionals
  • Test- en mainframeprofessionals
  • Professionals op het gebied van gegevensbeheer
  • Business intelligence-professionals
  • Projectmanagers
  • Aspirant datawetenschappers
  • Afgestudeerden
  • die carrière willen maken in big data-analyse

EXAMENINFORMATIE

Om een certificaat voor voltooiing van de cursus te behalen, moet u 85% van de cursus, één project en één simulatietest voltooien, met een minimumscore van 80%.

Het formele examen CCA175 - Spark en Hadoop-certificaat is niet beschikbaar als onderdeel van dit pakket, maar het leren helpt je wel om je voor te bereiden op zijn examen.

Bekijk onze website (addingvalue .nl) voor ons volledige aanbod van trainingen; zoals: AgilePM; AgilePM; Agile Scrum; AgileSHIFT; AWS; Better Business Cases (BBC); Change Management; CISM, CISSP; COBIT, DevOps; ITIL4; IT4IT; IPMA; ISO/IEC 27001; LeanIT; Management of Portfolios (MoP); Management of Risk (M_o_R); Management of Value (MoV); MSP; Paxis; PMI-ACP; PMI-RMP; PRINCE2; P3O; SAFe; Lean Six Sigma; Software Testing ISTQB; TOGAF; VeriSM en nog veel meer!

Wij hopen u ook te certificeren!

Blijf op de hoogte van nieuwe ervaringen

Er zijn nog geen ervaringen.

Deel je ervaring

Heb je ervaring met deze cursus? Deel je ervaring en help anderen kiezen. Als dank voor de moeite doneert Springest € 1,- aan Stichting Edukans.

Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

Download gratis en vrijblijvend de informatiebrochure

Aanhef
(optioneel)
(optioneel)
(optioneel)
(optioneel)
(optioneel)

Heb je nog vragen?

(optioneel)
We slaan je gegevens op om je via e-mail en evt. telefoon verder te helpen.
Meer info vind je in ons privacybeleid.