العودة إلى البيانات المفتوحة
معالجة اللغات واللغات

Goud-sum (HuggingFace) — Darija Summarization Dataset

نبذة

يحتوي Goud-sum على 158,282 زوجًا من المقالات والعناوين المستخرجة من موقع Goud.ma الإخباري. العناوين بالدارجة المغربية، والمقالات بالدارجة أو الفصحى أو خليط بينهما. مقسم إلى: تدريب (139k)، تحقق (9.5k)، اختبار (9.5k). الحجم: 326 ميجابايت.

https://huggingface.co/datasets/Goud/Goud-sum
زيارة الموقع