Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Introducere la Large Language Models (LLMs)
- Prezentare generală a LLM-urilor
- Definiție și semnificație
- Aplicații în IA în prezent
Arhitectura transformatoarelor
- Ce este un transformator și cum funcționează acesta?
- Principalele componente și caracteristici
- Încorporarea și codificarea pozițională
- Atenție la mai multe capete
- Rețea neuronală de tip feed-forward
- Normalizare și conexiuni reziduale
Modele de transformare
- Mecanismul de autoatenție
- Arhitectură codificator-decodificator
- Încorporări poziționale
- BERT (Reprezentări bidirecționale ale codificatorilor din transformatoare)
- GPT (transformator generativ preformat)
Optimizarea performanțelor și capcanele
- Lungimea contextului
- Mamba și modelele de spațiu de stare
- Atenția flash
- Transformatoare rarefiate
- Transformatoare de viziune
- Importanța cuantificării
Îmbunătățirea transformatoarelor
- Generarea de text augmentat pentru recuperare
- Amestec de modele
- Arbore de gânduri
Reglarea fină
- Teoria adaptării de rang scăzut
- Ajustarea fină cu QLora
Legi de scalare și optimizare în LLM-uri
- Importanța legilor de scalare pentru LLM-uri
- Scalarea dimensiunii datelor și a modelului
- Scalarea computațională
- Scalarea eficienței parametrilor
Optimizare
- Relația dintre dimensiunea modelului, dimensiunea datelor, bugetul de calcul și cerințele de inferență
- Optimizarea performanței și eficienței LLM-urilor
- Cele mai bune practici și instrumente pentru formarea și reglarea fină a LLM-urilor
Formarea și reglarea fină a LLM-urilor
- Etapele și provocările legate de formarea LLM-urilor de la zero
- Achiziționarea și întreținerea datelor
- Cerințele privind datele la scară largă, CPU și memoria
- Provocări legate de optimizare
- Peisajul LLM-urilor cu sursă deschisă
Elemente fundamentale ale Reinforcement Learning (RL)
- Introducere în Reinforcement Learning
- Învățare prin întărire pozitivă
- Definiție și concepte de bază
- Proces de decizie Markov (MDP)
- Programare dinamică
- Metode Monte Carlo
- Învățarea prin diferență temporală
Profundă Reinforcement Learning
- Rețele Q profunde (DQN)
- Optimizarea politicii proximale (PPO)
- Elements de Reinforcement Learning
Integrarea LLM-urilor și a Reinforcement Learning
- Combinarea LLM-urilor cu Reinforcement Learning
- Cum se utilizează RL în LLM-uri
- Reinforcement Learning cu feedback uman (RLHF)
- Alternative la RLHF
Studii de caz și aplicații
- Aplicații din lumea reală
- Povești de succes și provocări
Subiecte avansate
- Tehnici avansate
- Metode avansate de optimizare
- Cercetări și dezvoltări de ultimă oră
Rezumat și etapele următoare
Cerințe
- Înțelegerea de bază a Machine Learning
Audiență
- Oameni de știință în domeniul datelor
- Inginerii de software
21 ore