Schița de curs

Introducere în modelele LLM cu sursă deschisă

  • Ce sunt modelele cu greutăți deschise și de ce sunt importante
  • Pregătire generală despre LLaMA, Mistral, Qwen și alte modele comunitare
  • Uzuri pentru implementări private, locale sau sigure

Configurarea mediului și a instrumentelor

  • Instalarea și configurarea bibliotecilor Transformers, Datasets și PEFT
  • Alegerea hardware-ului potrivit pentru ajustarea fină
  • Încărcarea modelelor preantrenate din Hugging Face sau alte depozite

Pregătirea datelor și preprocesarea

  • Formatele seturilor de date (ajustare instrucțiuni, date chat, text doar)
  • Tokenizarea și gestionarea secvențelor
  • Creația seturilor de date personalizate și a dată loader-ului

Tehnici Fine-Tuning

  • Ajustare completă standard vs. metode eficiente la nivel de parametru
  • Aplicarea LoRA și QLoRA pentru ajustare fină eficientă
  • Folosirea Trainer API pentru experimente rapide

Evaluarea modelului și optimizarea

  • Evaluearea modelelor ajustate prin metrici de generare și acuratețe
  • Gestionarea supraprendării, generalizării și seturilor de validare
  • Sfaturi pentru tunarea performanței și logging

Implementare și utilizare privată

  • Salvarea și încărcarea modelelor pentru inferență
  • Implementarea modelului ajustat în medii de afaceri sigure
  • Strategii de implementare locală vs. la nivel de cloud

Cazuri studiu și Use Cases

  • Exemple de utilizare a LLaMA, Mistral și Qwen în afaceri
  • Gestionarea ajustării fine multilingviste și specifică domeniului
  • Discuție: trade-off-uri între modele deschise și închise

Rezumat și următoarele pași

Cerințe

  • O înțelegere a modelelor de limbaj mari (LLMs) și a arhitecturii lor
  • Experiență cu Python și PyTorch
  • Familiaritate de bază cu ecosistemul Hugging Face

Publicul vizat

  • Practicienii în domeniul ML
  • Dezvoltatorii AI
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite