Hindi-Datensatz
हिंदी डेटासेट
Hochwertiger Hindi-Callcenter-, allgemeiner Konversations- und Podcast-Datensatz für KI- und ASR-Modelle
Übersicht
Titel (Sprache)
Hindi-Sprachdatensatz
Datensatztypen
Callcenter, allgemeine Konversation, Medien (Podcast), geskripteter Monolog
Land
Indien
Beschreibung
Es stehen nicht geskriptete Telefongespräche zwischen zwei Personen mit einer Dauer von 15 bis 60 Minuten zur Verfügung. Darüber hinaus stehen lizenzierbare, gemeinfreie Audio- oder Videodateien wie Interviews und Podcasts mit 1 bis 5 Teilnehmern im gleichen Zeitraum zur Verfügung. Darüber hinaus sind Aufnahmen einzelner Äußerungen in der Regel 5 bis 30 Sekunden lang. Auch geskriptete Monologdaten sind verfügbar.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 70:45:51 | Auf Anfrage |
| Call Center | 8 kHz | 2 Lautsprecher | Mono | 20,000:00:00 | Auf Anfrage |
| Call Center | 16 kHz | 2 Lautsprecher | Mono | 29:17:20 | 261 |
| Call Center | 16 kHz | 2 Lautsprecher | Dual | 400:27:10 | 1200 |
| Allgemeine Konversation | 8 kHz | 2 Lautsprecher | Dual | 47:48:40 | 224 |
| Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 227:57:43 | 438 |
| Geskripteter Monolog | 48 kHz | Einzelner Lautsprecher | Mono | 2,866:00:00 | 3,988 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 29,000:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden