Übersicht
Titel (Sprache)
Chinesischer Sprachdatensatz
Datensatztypen
Callcenter, Musik, geskripteter Monolog, Mediendaten (Podcast-Daten)
Land
China
Beschreibung
Dieser Datensatz umfasst nicht geskriptete synthetische Telefongespräche zwischen Agenten und Kunden (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Gesangsaudio mit Transkriptionen und bietet so vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| SPRACHE: Englisch | Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|---|
| Chinesischer Gesang | Musik | 48 kHz | Einzelner Lautsprecher | Mono | 06:11:32 | 10 |
| Chinesisch (traditionell) | Geskripteter Monolog | 48 kHz | Einzelner Lautsprecher | Mono | 1,499:00:00 | 1,805 |
| Englisch mit chinesischem Akzent | Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 306:04:58 | 2,130 |
| Chinesisch vereinfacht | Geskripteter Monolog | 48 kHz | Einzelner Lautsprecher | Mono | 2,761:00:00 | 3,725 |
| Chinesisches Englisch mit US-Akzent | Call Center | 8 kHz | 2 Lautsprecher | Dual | 152:18:33 | 2,058 |
| Chinesisches Englisch mit US-Akzent | Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 245:55:15 | 468 |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden