Tamilischer Datensatz
தமிழ் தரவுத்தொகுப்பு
Nutzen Sie die Leistungsfähigkeit tamilischer Sprachdatensätze für ASR, TTS und Konversations-KI. Shaip bietet erstklassige tamilische Audiodatensätze zum Trainieren intelligenter Sprachmodelle.
Übersicht
Titel (Sprache)
Tamilischer Sprachdatensatz
Datensatztypen
Callcenter, allgemeine Konversation, Mediendaten, geskripteter Monolog
Land
Indien
Beschreibung
Dieser Datensatz umfasst nicht geskriptete synthetische Agent-Kunden-Gespräche (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Mediendaten mit Transkriptionen und bietet vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 124:23:52 | 484 |
| Call Center | 16 kHz | 2 Lautsprecher | Mono | 199:44:21 | 1,986 |
| Allgemeine Konversation | 8 kHz | 2 Lautsprecher | Dual | 101:42:05 | 440 |
| Allgemeine Konversation | 48 kHz | 2 Lautsprecher | Mono | 80:21:16 | 141 |
| Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 43:07:01 | 32 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 500:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden