Kannada-Datensatz
ಕನ್ನಡ ಡೇಟಾಸೆಟ್
Hochwertiger Kannada-Datensatz für Callcenter, allgemeine Gespräche, geskriptete Monologe und Medien (Podcasts) für KI- und Sprachmodelle
Übersicht
Titel (Sprache)
Kannada-Sprachdatensatz
Datensatztypen
Callcenter, allgemeine Konversation, Mediendaten, geskripteter Monolog
Land
Indien
Beschreibung
Dieser Datensatz umfasst nicht geskriptete Telefongespräche zwischen synthetischen Agenten und Kunden (5–15 Minuten), lizenzierbare gemeinfreie Audio- oder Videodateien wie Interviews und Podcasts mit 1 bis 5 Teilnehmern (15–60 Minuten) sowie geskriptete Monologe, in denen ein einzelner Sprecher vordefinierte Inhalte zum Trainieren und Bewerten von Sprach- und Sprechmodellen liefert.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 59:57:02 | 494 |
| Call Center | 16 kHz | 2 Lautsprecher | Mono | 195:26:56 | 9,504 |
| Allgemeine Konversation | 8 kHz | 2 Lautsprecher | Dual | 141:27:15 | 424 |
| Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 14:19:52 | 124 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 500:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden