Schița de curs
Introducere
- Definirea "Procesării Industriale de Limbaj Natural"
Instalarea spaCy
Componentele spaCy
- Etichetorul părților vorbe (part-of-speech tagger)
- Recunoaștorul de entități numite (named entity recognizer)
- Parser-ul de dependențe (dependency parser)
Prezentare generală a funcțiilor și sintaxei spaCy
Înțelegerea modelării în spaCy
- Modelarea statistică și predicția
Folosirea Interfetei de Linie de Comandă (CLI) a lui spaCy
- Comenzi de bază
Crearea unei aplicații simple pentru prezicerea comportamentului
Antrenarea unui nou model statistic
- Date (pentru antrenare)
- Etichete (etichete, entități numite, etc.)
Încărcarea modelului
- Amestecarea și buclarea
Salvarea modelului
Furnizarea de feedback pentru model
- Gradiente de eroare
Actualizarea modelului
- Actualizarea recunoaștorului de entități (entity recognizer)
- Extragerea de token-uri folosind matcher-ul bazat pe reguli
Dezvoltarea unei teorii generalizate pentru rezultatele așteptate
Studiul de caz
- Distingerea numelor de produse de numele companiilor
Rafinarea datelor de antrenare
- Selectarea datelor reprezentative
- Setarea ratei dropout
Alte stiluri de antrenament
- Trecerea texturilor raw (neelaborate)
- Trecerea dicționarelor de anotări
Folosirea spaCy pentru preprocesarea textului în Învățarea Profundă (Deep Learning)
Integrarea spaCy cu aplicațiile legacy
Testarea și depistarea erorilor modelului spaCy
- Importanța iterației
Implementarea modelului în producție
Monitorizarea și ajustarea modelului
Troubleshooting (rezolvarea problemelor)
Rezumat și concluzii
Cerințe
- Experiență în programarea Python.
- O înțelegere de bază a statisticilor.
- Experiență cu linia de comandă (command line).
Audiență
- Dezvoltatori
- Savanți datelor
Mărturii (3)
Faptul că există mai multe exerciții practice care folosesc date mai similare cu cele pe care le utilizăm în proiectele noastre (imaginea satelitării în format rastersc)
Matthieu - CS Group
Curs - Scaling Data Analysis with Python and Dask
Tradus de catre o masina
Prepararea și expertiza excelente a instrucționarului, comunicare perfectă în limba engleză. Cursul a fost practic (exerciții + împărtășirea exemplelor de cazuri de utilizare)
Monika - Procter & Gamble Polska Sp. z o.o.
Curs - Developing APIs with Python and FastAPI
Tradus de catre o masina
Instrucționistul dezvoltă instruirea în funcție de ritmul participanților
Farris Chua
Curs - Data Analysis in Python using Pandas and Numpy
Tradus de catre o masina