Kannada-Datensatz

ಕನ್ನಡ ಡೇಟಾಸೆಟ್

Hochwertiger Kannada-Datensatz für Callcenter, allgemeine Gespräche, geskriptete Monologe und Medien (Podcasts) für KI- und Sprachmodelle

Übersicht

Titel (Sprache)

Kannada-Sprachdatensatz

Datensatztypen

Callcenter, allgemeine Konversation, Mediendaten, geskripteter Monolog

Land

Indien

Beschreibung

Dieser Datensatz umfasst nicht geskriptete Telefongespräche zwischen synthetischen Agenten und Kunden (5–15 Minuten), lizenzierbare gemeinfreie Audio- oder Videodateien wie Interviews und Podcasts mit 1 bis 5 Teilnehmern (15–60 Minuten) sowie geskriptete Monologe, in denen ein einzelner Sprecher vordefinierte Inhalte zum Trainieren und Bewerten von Sprach- und Sprechmodellen liefert.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Call Center 8 kHz 2 Lautsprecher Dual 59:57:02 494
Call Center 16 kHz 2 Lautsprecher Mono 195:26:56 9,504
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 141:27:15 424
Mediendaten 16 kHz Mehrere Lautsprecher Mono 14:19:52 124
Geskripteter Monolog 24 kHz Einzelner Lautsprecher Mono 500:00:00 Auf Anfrage

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden