Schița de curs

Introducere în Modelele LLM Open-Source

  • Ce sunt modelele cu greutăți deschise și de ce sunt importante
  • Prezentare generală a modelelor LLaMA, Mistral, Qwen și altor modele din comunitate
  • Cazuri de utilizare pentru implementări private, on-premise sau sigure

Configurarea mediului și instrumente

  • Instalarea și configurarea bibliotecilor Transformers, Datasets și PEFT
  • Alegerea hardware-ului potrivit pentru ajustarea fină
  • Încărcarea modelelor pre-antrenate de pe Hugging Face sau din alte depozite

Pregătirea și preprocesarea datelor

  • Formate de seturi de date (instrucțiuni de ajustare, date de chat, doar text)
  • Tokenizare și gestionarea secvențelor
  • Crearea de seturi de date personalizate și încărcătoare de date

Tehnici de Ajustare Fină

  • Ajustarea fină standard vs. metode eficiente din punct de vedere al parametrilor
  • Aplicarea LoRA și QLoRA pentru ajustarea fină eficientă
  • Utilizarea API-ului Trainer pentru experimentare rapidă

Evaluarea și optimizarea modelului

  • Evaluarea modelelor ajustate cu metrici de generare și acuratețe
  • Gestionarea supraantrenării, generalizării și seturilor de validare
  • Sfaturi pentru optimizarea performanței și logare

Implementare și utilizare privată

  • Salvarea și încărcarea modelelor pentru inferență
  • Implementarea modelelor ajustate în medii de întreprindere sigure
  • Strategii de implementare on-premise vs. cloud

Studii de caz și cazuri de utilizare

  • Exemple de utilizare a modelelor LLaMA, Mistral și Qwen în întreprinderi
  • Gestionarea ajustării fine multilingve și specifice domeniului
  • Discuție: Compromisuri între modele deschise și închise

Rezumat și pași următori

Cerințe

  • Înțelegerea modelelor de limbaj de mare dimensiune (LLM) și a arhitecturii lor
  • Experiență cu Python și PyTorch
  • Cunoștințe de bază despre ecosistemul Hugging Face

Public țintă

  • Practicieni ML
  • Dezvoltatori AI
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite