Schița de curs
Introducere la Reinforcement Learning
- Ce este învățarea prin consolidare?
- Concepte-cheie: agent, mediu, stări, acțiuni și recompense
- Provocări în învățarea prin consolidare
Explorare și exploatare
- Echilibrarea explorării și exploatării în modelele RL
- Strategii de explorare: epsilon-greedy, softmax și altele
Q-Learning și rețele Q adânci (DQN)
- Introducere în Q-learning
- Implementarea rețelelor DQN utilizând TensorFlow
- Optimizarea învățării Q cu reluarea experienței și rețele țintă
Metode bazate pe politici
- Algoritmi de gradient de politică
- Algoritmul REINFORCE și implementarea acestuia
- Metode actor-critice
Lucrul cu OpenAI Gym
- Configurarea mediilor în OpenAI Gym
- Simularea agenților în medii dinamice
- Evaluarea performanței agenților
Tehnici Reinforcement Learning avansate
- Învățarea prin consolidare a mai multor agenți
- Gradient determinist profund al politicii (DDPG)
- Optimizarea proximală a politicilor (PPO)
Implementarea modelelor Reinforcement Learning
- Aplicații din lumea reală ale învățării prin consolidare
- Integrarea modelelor RL în mediile de producție
Rezumat și etapele următoare
Cerințe
- Experiență cu programarea Python
- Înțelegere de bază a învățării profunde și a conceptelor de învățare automată
- Cunoașterea algoritmilor și a conceptelor matematice utilizate în învățarea prin consolidare
Audiență
- Oameni de știință în domeniul datelor
- Profesioniști în domeniul învățării automate
- Cercetători AI
Mărturii (4)
foarte prietenos și de ajutor
Aktar Hossain - Unit4
Curs - Building Microservices with Microsoft Azure Service Fabric (ASF)
Tradus de catre o masina
Configurarea manuală fără server. De asemenea, nu am avut nici o idee că consola web sls iese, ceea ce este frumos.
Rafal Kucharski - The Software House sp. z o.o.
Curs - Serverless Framework for Developers
Tradus de catre o masina
Toate bine, nimic de îmbunătățit
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Curs - AWS Lambda for Developers
Tradus de catre o masina
Aplicații IoT
Palaniswamy Suresh Kumar - Makers' Academy
Curs - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
Tradus de catre o masina