Telugu-Datensatz

తెలుగు డేటాసెట్‌లు

Hochwertiger Telugu-Callcenter-, allgemeiner Konversations-, geskripteter Monolog- und Medien-(Podcast-)Datensatz für KI- und Sprachmodelle

Übersicht

Titel (Sprache)

Telgu-Sprachdatensatz

Datensatztypen

Callcenter, allgemeine Konversation, Musik, geskripteter Monolog

Land

Indien

Beschreibung

Dieser Datensatz umfasst nicht geskriptete synthetische Agent-Kunden-Gespräche (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Mediendaten mit Transkriptionen und bietet vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Call Center 8 kHz 2 Lautsprecher Dual 62:32:27 496
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 654:08:03 1,601
Mediendaten 16 kHz Mehrere Lautsprecher Mono 666:24:29 1,230
Geskripteter Monolog 24 kHz Einzelner Lautsprecher Mono 1,700:00:00 Auf Anfrage

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden