Retour aux données ouvertes
NLP & Langues

DVoice — Moroccan Darija ASR Dataset

À Propos

DVoice est un dataset open source pour la Reconnaissance Automatique de la Parole (ASR) en arabe dialectal marocain (Darija). Contient des enregistrements vocaux et leurs transcriptions textuelles. 2392 fichiers d'entraînement et 600 de test. Publié par AIOXLABS, référence Zenodo 2021.

https://github.com/AIOXLABS/DVoice
Visiter le site