العودة إلى البيانات المفتوحة
معالجة اللغات واللغات
Darija-NLP-Resources — MoroccoAI
نبذة
مجموعة منسقة من الموارد والمشاريع لمعالجة اللغات الطبيعية الخاصة بالدارجة المغربية (Darija). تشمل مجموعات البيانات، النماذج، الأدوات، والأبحاث المتعلقة بمعالجة اللغات الطبيعية للدارجة. مفيدة للباحثين والمطورين المهتمين بمعالجة اللغات الطبيعية للدارجة المغربية.
https://github.com/MoroccoAI/Arabic-Darija-NLP-Resources
زيارة الموقعفي نفس الفئة
Goud-sum (HuggingFace) — Darija Summarization Dataset
158 ألف مقالة + عناوين من موقع Goud.ma — مجموعة بيانات تلخيص نصوص بالدارجة/العربية الفصحى
Darija Open Dataset (DODa)
أكثر من 100 ألف مدخل للترجمة من الدارجة إلى الإنجليزية — أكبر مجموعة بيانات مفتوحة المصدر للدارجة
MA_Open_Datasets — Goud.ma
مقالات Goud الإخبارية بصيغة CSV — توزيع بديل لبيانات Goud
MA_Open_Datasets — LeMatin
مقالات جريدة Le Matin مصنفة حسب الفئة — وطن، اقتصاد، ثقافة، رياضة