Schița de curs

Introducere în Generarea Augmentată de Recuperare (RAG)

  • Ce este RAG și de ce este important pentru AI-ul enterprise
  • Componentele unui sistem RAG: recuperator, generator, magazie documente
  • Comparație cu LLM-uri standalone și căutarea vectorială

Configurarea unei Pipeline RAG

  • Instalarea și configurarea Haystack sau alți cadre similari
  • Ingestionarea documentelor și preprocesarea acestora
  • Conectarea recuperatorilor la baze de date vectoriale (de exemplu, FAISS, Pinecone)

Fine-Tuning-ul Recuperatorului

  • Antrenarea recuperatorilor densi folosind date specifice domeniului
  • Folosirea transformerelor de propoziții și învățarea contrastivă
  • Evaluarea calității recuperatorului cu top-k accuracy

Fine-Tuning-ul Generatorului

  • Selectarea modelilor de bază (de exemplu, BART, T5, FLAN-T5)
  • Învățarea instrucțiunilor vs. fine-tuning supravegheat
  • Metode LoRA și PEFT pentru actualizări eficiente

Evaluarea și Optimizarea

  • Metrice pentru evaluarea performanței RAG (de exemplu, BLEU, EM, F1)
  • Latencie, calitatea recuperării și reducerea halucinațiilor
  • Urmarirea experimentelor și îmbunătățire iterativă

Implementarea și Integrarea în Lumea Reală

  • Implementarea RAG în motoarele de căutare interne și chatboturi
  • Considerente privind securitatea, accesul la date și guvernanța acestora
  • Integrarea cu API-uri, panouri de control sau portaluri de cunoștințe

Cazuri de Studiu și Prințipii de Bază

  • Cazuri de utilizare enterprise în finanțe, sănătate și domeniul legal
  • Gestionarea drift-ului de domeniu și actualizărilor bazei de cunoștințe
  • Direcții viitoare în sistemele LLM augmentate prin recuperare

Rezumat și Următorii Pași

Cerințe

  • O înțelegere a conceptelor de procesare a limbajului natural (NLP)
  • Experiență cu modele lingvistice bazate pe transformer
  • Familiaritate cu Python și fluxuri de lucru de machine learning de bază

Audientă

  • Ingineri NLP
  • Echipe de management al cunoștințelor
 14 ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite