Hindi-Datensatz

हिंदी डेटासेट

Hochwertiger Hindi-Callcenter-, allgemeiner Konversations- und Podcast-Datensatz für KI- und ASR-Modelle

Übersicht

Titel (Sprache)

Hindi-Sprachdatensatz

Datensatztypen

Callcenter, allgemeine Konversation, Medien (Podcast), geskripteter Monolog

Land

Indien

Beschreibung

Es stehen nicht geskriptete Telefongespräche zwischen zwei Personen mit einer Dauer von 15 bis 60 Minuten zur Verfügung. Darüber hinaus stehen lizenzierbare, gemeinfreie Audio- oder Videodateien wie Interviews und Podcasts mit 1 bis 5 Teilnehmern im gleichen Zeitraum zur Verfügung. Darüber hinaus sind Aufnahmen einzelner Äußerungen in der Regel 5 bis 30 Sekunden lang. Auch geskriptete Monologdaten sind verfügbar.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Call Center 8 kHz 2 Lautsprecher Dual 70:45:51 Auf Anfrage
Call Center 8 kHz 2 Lautsprecher Mono 20,000:00:00 Auf Anfrage
Call Center 16 kHz 2 Lautsprecher Mono 29:17:20 261
Call Center 16 kHz 2 Lautsprecher Dual 400:27:10 1200
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 47:48:40 224
Mediendaten 16 kHz Mehrere Lautsprecher Mono 227:57:43 438
Geskripteter Monolog 48 kHz Einzelner Lautsprecher Mono 2,866:00:00 3,988
Geskripteter Monolog 24 kHz Einzelner Lautsprecher Mono 29,000:00:00 Auf Anfrage

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden