Koreanischer Datensatz
한국어 데이터셋
Hochwertiger koreanischer Callcenter-, geskripteter Monolog- und Medien-(Podcast-)Datensatz für KI- und Sprachmodelle
Übersicht
Titel (Sprache)
Koreanischer Sprachdatensatz
Datensatztypen
Callcenter, Mediendaten, geskripteter Monolog
Land
Korea
Beschreibung
Dieser Datensatz umfasst nicht geskriptete Telefongespräche zwischen synthetischen Agenten und Kunden (5–15 Minuten), lizenzierbare gemeinfreie Audio-/Videodateien wie Interviews und Podcasts mit 1 bis 5 Teilnehmern (15–60 Minuten) sowie geskriptete Monologe mit einem einzelnen Sprecher, der vordefinierte Inhalte für das Training von Sprach- und Sprachmodellen liefert.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 102:27:55 | 1,244 |
| Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 203:46:54 | 397 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 500:00:00 | Auf Anfrage |
| Geskripteter Monolog | 48 kHz | Einzelner Lautsprecher | Mono | 1,955:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden