Retour aux données ouvertes
NLP & Langues
MSAC — Moroccan Arabic Sentiment Analysis Corpus
À Propos
Corpus de 2000 tweets en arabe marocain (Darija) collectés sur Twitter, annotés manuellement pour l'analyse de sentiment. Publié en lien avec la conférence BDCA 2018 (Kenitra, Maroc). Format ARFF. Utile pour les modèles d'analyse de sentiment en dialecte marocain.
https://github.com/ososs/Arabic-Sentiment-Analysis-corpus
Visiter le siteDans la même catégorie
Goud-sum (HuggingFace) — Darija Summarization Dataset
158k articles + headlines from Goud.ma — Darija/MSA text summarization dataset
Darija Open Dataset (DODa)
100k+ entries darija↔English — largest open source Darija translation dataset
MA_Open_Datasets — Goud.ma
Goud news articles in CSV format — alternative distribution of Goud data
MA_Open_Datasets — LeMatin
Le Matin newspaper articles by category — nation, économie, culture, sport