Building AI Agents with Multimodal Models - Dag
Deze training is ontwikkeld voor:
- Data Scientists
- AI Engineers
- Deep Learning Specialisten
- Robotics Engineers
- Softwareontwikkelaars die werken met neurale netwerken
- Professionals die werken met sensor- of beelddata en AI willen inzetten voor analyse en voorspelling
In deze training leer je hoe je neurale netwerken ontwikkelt die verschillende datatypes combineren – van LiDAR-scans tot tekst uit documenten – om betere voorspellingen en analyses mogelijk te maken.
Admission
- Basiskennis van deep learning-concepten
- Ervaring met een deep learning-framework zoals TensorFlow, PyTorch of Keras (de training gebruikt PyTorch)
Graduation
Na afloop van deze training ontvang je het deelnamecertificaat…
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
Deze training is ontwikkeld voor:
- Data Scientists
- AI Engineers
- Deep Learning Specialisten
- Robotics Engineers
- Softwareontwikkelaars die werken met neurale netwerken
- Professionals die werken met sensor- of beelddata en AI willen inzetten voor analyse en voorspelling
In deze training leer je hoe je neurale netwerken ontwikkelt die verschillende datatypes combineren – van LiDAR-scans tot tekst uit documenten – om betere voorspellingen en analyses mogelijk te maken.
Admission
- Basiskennis van deep learning-concepten
- Ervaring met een deep learning-framework zoals TensorFlow, PyTorch of Keras (de training gebruikt PyTorch)
Graduation
Na afloop van deze training ontvang je het deelnamecertificaat ‘Building AI Agents with Multimodal Models’ van Computrain.
Objectives
- Praktische, projectgerichte aanpak
- Combinatie van theorie, videolabs en hands-on opdrachten
- Gebruik van PyTorch, OCR-tools, vectordatabases en multimodale AI-frameworks
- Stap-voor-stap begeleiding bij het bouwen en orkestreren van multimodale modellen
Program guide
Inhoud- Early en late fusion: camera- en LiDAR-data combineren
- Intermediate fusion: architecturen ontwerpen voor multimodale netwerken
- Cross-modal projection: language models aanpassen voor visuele data (Vision Language Models, VLM's)
- Model orchestration: modellen combineren om complexe vragen te beantwoorden (o.a. videoanalyse met Cosmos Nemotron)
- Assessment: zelf een model aanpassen voor andere inputdata
Course schedule
2 dagenCharacteristics
TrainingenShort program
C-BAIAMM|Building AI Agents with Multimodal ModelsCommercial partners
Brand OwnerEr zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
