Retour aux données ouvertes
NLP & Langues
Darija-NLP-Resources — MoroccoAI
À Propos
Collection organisée de ressources et dépôts pour les tâches de traitement du langage naturel spécifiques à la Darija, le dialecte arabe marocain. Inclut des datasets, modèles, outils et recherches. Utile pour les chercheurs et développeurs travaillant avec le NLP en arabe marocain.
https://github.com/MoroccoAI/Arabic-Darija-NLP-Resources
Visiter le siteDans la même catégorie
Goud-sum (HuggingFace) — Darija Summarization Dataset
158k articles + headlines from Goud.ma — Darija/MSA text summarization dataset
Darija Open Dataset (DODa)
100k+ entries darija↔English — largest open source Darija translation dataset
MA_Open_Datasets — Goud.ma
Goud news articles in CSV format — alternative distribution of Goud data
MA_Open_Datasets — LeMatin
Le Matin newspaper articles by category — nation, économie, culture, sport