Koreanischer Datensatz

한국어 데이터셋

Hochwertiger koreanischer Callcenter-, geskripteter Monolog- und Medien-(Podcast-)Datensatz für KI- und Sprachmodelle

Übersicht

Titel (Sprache)

Koreanischer Sprachdatensatz

Datensatztypen

Callcenter, Mediendaten, geskripteter Monolog

Land

Korea

Beschreibung

Dieser Datensatz umfasst nicht geskriptete Telefongespräche zwischen synthetischen Agenten und Kunden (5–15 Minuten), lizenzierbare gemeinfreie Audio-/Videodateien wie Interviews und Podcasts mit 1 bis 5 Teilnehmern (15–60 Minuten) sowie geskriptete Monologe mit einem einzelnen Sprecher, der vordefinierte Inhalte für das Training von Sprach- und Sprachmodellen liefert.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Call Center 8 kHz 2 Lautsprecher Dual 102:27:55 1,244
Mediendaten 16 kHz Mehrere Lautsprecher Mono 203:46:54 397
Geskripteter Monolog 24 kHz Einzelner Lautsprecher Mono 500:00:00 Auf Anfrage
Geskripteter Monolog 48 kHz Einzelner Lautsprecher Mono 1,955:00:00 Auf Anfrage

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden