العودة إلى البيانات المفتوحة
المستودعات المجتمعية
MA_Open_Datasets — Moroccan NLP Corpora
نبذة
مستودع شامل يجمع مجموعات بيانات معالجة اللغات الطبيعية المغربية. يحتوي على 6 مجموعات فرعية: Goud.ma، LeMatin، MoroccoWorldNews، تعليقات يوتيوب، Booking_ma، Jumia.ma.
https://github.com/OumaimaHourrane/MA_Open_Datasets
زيارة الموقعفي نفس الفئة
Moroccan-Darija-Datasets — nainiayoub
مجموعة شاملة من مجموعات بيانات الدarja المغربية — 13 مجموعة مصنفة
Darija-NLP-Resources — MoroccoAI
مجموعة منسقة من الموارد والمشاريع لمعالجة اللغات الطبيعية الخاصة بالدarja المغربية
Darija-Dataset-Builder — IlyasFardaouix
خط أنابيب قابل للتطوير لبناء مجموعات بيانات الدarja المغربية لتدريب نماذج اللغة الكبيرة
Offensive-Darija-Detection — a-ibrahimi
مجموعة بيانات الدarja المغربية للكشف عن المحتوى المسيء — مصنفة يدويًا