Marathi-Datensatz
मराठी डेटासेट
Hochwertiger Marathi-Callcenter-, allgemeiner Konversations-, geskripteter Monolog- und Medien-(Podcast-)Datensatz für KI- und Sprachmodelle
Übersicht
Titel (Sprache)
Marathi-Sprachdatensatz
Datensatztypen
Callcenter, allgemeine Konversation, Medien (Podcast), geskripteter Monolog
Land
Indien
Beschreibung
Dieser Datensatz umfasst nicht geskriptete synthetische Telefongespräche zwischen Agenten und Kunden (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Gesangsaudio mit Transkriptionen und bietet so vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 70:28:58 | 634 |
| Allgemeine Konversation | 8 kHz | 2 Lautsprecher | Dual | 159:21:13 | 298 |
| Mediendaten | 16 kHz | Multipal-Lautsprecher | Mono | 24:09:24 | 94 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 3,900:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden