Retour aux données ouvertes
Dépôts Communautaires
MA_Open_Datasets — Moroccan NLP Corpora
À Propos
A comprehensive repository (OumaimaHourrane) gathering Moroccan NLP datasets and corpora. Contains: Goud.ma (news), LeMatin (newspaper), MoroccoWorldNews (news), ma_youtube_comments (social media), Booking_ma (hotels), Jumia.ma (e-commerce). Built with Jupyter Notebook. Ideal starting point for Moroccan NLP research.
https://github.com/OumaimaHourrane/MA_Open_Datasets
Visiter le siteDans la même catégorie
Moroccan-Darija-Datasets — nainiayoub
Collection complète de datasets en Darija marocaine — 13 datasets catégorisés
Darija-NLP-Resources — MoroccoAI
Collection organisée de ressources et dépôts pour les tâches NLP en Darija
Darija-Dataset-Builder — IlyasFardaouix
Pipeline évolutif pour créer des datasets NLP en Darija marocaine pour l'entraînement de LLM
Offensive-Darija-Detection — a-ibrahimi
Dataset de détection de langage offensant en Darija marocaine — annoté manuellement