Retour aux données ouvertes
NLP & Langues

QADI — QCRI Arabic Dialect Identification

À Propos

QADI (QCRI Arabic Dialect Identification) : dataset de 540 000 tweets pour identifier les dialectes arabes, couvrant les grandes régions dont le Maghreb (Maroc inclus), le Levant, l'Égypte et le Golfe. Publié par le Qatar Computing Research Institute (QCRI) en 2020.

https://github.com/qcri/QADI
Visiter le site