Retour aux données ouvertes
NLP & Langues

IADD — Integrated Arabic Dialect Identification Dataset

À Propos

Dataset intégré d'identification de dialectes arabes (IADD) : 135 804 textes provenant de Twitter, Facebook, transcriptions manuelles et commentaires de presse. Couvre 4 grandes régions dialectales : Maghreb (dont Maroc), Levant, Égypte, Golfe. Publié en 2022 dans Data in Brief.

https://github.com/JihadZa/IADD
Visiter le site