Telugu-Datensatz
తెలుగు డేటాసెట్లు
Hochwertiger Telugu-Callcenter-, allgemeiner Konversations-, geskripteter Monolog- und Medien-(Podcast-)Datensatz für KI- und Sprachmodelle
Übersicht
Titel (Sprache)
Telgu-Sprachdatensatz
Datensatztypen
Callcenter, allgemeine Konversation, Musik, geskripteter Monolog
Land
Indien
Beschreibung
Dieser Datensatz umfasst nicht geskriptete synthetische Agent-Kunden-Gespräche (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Mediendaten mit Transkriptionen und bietet vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 62:32:27 | 496 |
| Allgemeine Konversation | 8 kHz | 2 Lautsprecher | Dual | 654:08:03 | 1,601 |
| Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 666:24:29 | 1,230 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 1,700:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden