Moroccan-Darija-Datasets — nainiayoub
نبذة
مجموعة شاملة من مجموعات بيانات الدarja المغربية (Darija) مصنفة حسب الاسم ومصدر البيانات والمنطقة والحجم. تحتوي على 13 مجموعة بيانات تغطي مختلف جوانب معالجة اللغات الطبيعية للدarja، بما في ذلك تحليل المشاعر، وتحديد اللهجات، والترجمة، والتلخيص، والتعرف على الكلام، والتعرف على الكيانات المسماة، والكشف عن النصوص، والكشف عن المحتوى المسيء، واستهلاك الكهرباء، والأخبار، والبيانات الصوتية، وقواعد بيانات الأسماء، وتحليل المشاعر، والكشف عن الشائعات، والبيانات المكانية.
في نفس الفئة
MA_Open_Datasets — Moroccan NLP Corpora
مجموعة كاملة من مجموعات بيانات معالجة اللغات الطبيعية المغربية — 6 مجموعات فرعية
Darija-NLP-Resources — MoroccoAI
مجموعة منسقة من الموارد والمشاريع لمعالجة اللغات الطبيعية الخاصة بالدarja المغربية
Darija-Dataset-Builder — IlyasFardaouix
خط أنابيب قابل للتطوير لبناء مجموعات بيانات الدarja المغربية لتدريب نماذج اللغة الكبيرة
Offensive-Darija-Detection — a-ibrahimi
مجموعة بيانات الدarja المغربية للكشف عن المحتوى المسيء — مصنفة يدويًا