Tamilischer Datensatz

தமிழ் தரவுத்தொகுப்பு

Nutzen Sie die Leistungsfähigkeit tamilischer Sprachdatensätze für ASR, TTS und Konversations-KI. Shaip bietet erstklassige tamilische Audiodatensätze zum Trainieren intelligenter Sprachmodelle.

Übersicht

Titel (Sprache)

Tamilischer Sprachdatensatz

Datensatztypen

Callcenter, allgemeine Konversation, Mediendaten, geskripteter Monolog

Land

Indien

Beschreibung

Dieser Datensatz umfasst nicht geskriptete synthetische Agent-Kunden-Gespräche (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Mediendaten mit Transkriptionen und bietet vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Call Center 8 kHz 2 Lautsprecher Dual 124:23:52 484
Call Center 16 kHz 2 Lautsprecher Mono 199:44:21 1,986
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 101:42:05 440
Allgemeine Konversation 48 kHz 2 Lautsprecher Mono 80:21:16 141
Mediendaten 16 kHz Mehrere Lautsprecher Mono 43:07:01 32
Geskripteter Monolog 24 kHz Einzelner Lautsprecher Mono 500:00:00 Auf Anfrage

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden