Chinesischer Datensatz

简体中文数据集

Hochwertiger chinesischer Datensatz für KI- und Sprachmodelle

Übersicht

Titel (Sprache)

Chinesischer Sprachdatensatz

Datensatztypen

Callcenter, Musik, geskripteter Monolog, Mediendaten (Podcast-Daten)

Land

China

Beschreibung

Dieser Datensatz umfasst nicht geskriptete synthetische Telefongespräche zwischen Agenten und Kunden (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Gesangsaudio mit Transkriptionen und bietet so vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

SPRACHE: Englisch Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Chinesischer Gesang Musik 48 kHz Einzelner Lautsprecher Mono 06:11:32 10
Chinesisch (traditionell) Geskripteter Monolog 48 kHz Einzelner Lautsprecher Mono 1,499:00:00 1,805
Englisch mit chinesischem Akzent Mediendaten 16 kHz Mehrere Lautsprecher Mono 306:04:58 2,130
Chinesisch vereinfacht Geskripteter Monolog 48 kHz Einzelner Lautsprecher Mono 2,761:00:00 3,725
Chinesisches Englisch mit US-Akzent Call Center 8 kHz 2 Lautsprecher Dual 152:18:33 2,058
Chinesisches Englisch mit US-Akzent Mediendaten 16 kHz Mehrere Lautsprecher Mono 245:55:15 468

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden