Bengalischer Datensatz
বাংলা ডেটাসেট
Hochwertiger bengalischer Callcenter-, Allgemeingesprächs- und Podcast-Datensatz für KI- und Sprachmodelle
Übersicht
Titel (Sprache)
Bengalischer Sprachdatensatz
Datensatztypen
Callcenter, allgemeine Konversation, Mediendaten (Podcast-Daten), geskripteter Monolog
Land
Indien
Beschreibung
Es stehen synthetische, nicht geskriptete Telefongespräche zwischen einem Agenten und einem Kunden mit einer ungefähren Dauer von 5 bis 15 Minuten zur Verfügung. Darüber hinaus sind lizenzierbare, gemeinfreie Audio- oder Videodateien wie Interviews, Podcasts und ähnliche Inhalte mit 1 bis 5 Teilnehmern mit einer ungefähren Dauer von 15 bis 60 Minuten verfügbar.
Luftüberwachung
ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
Datensatzdetails
| Datensatztyp | Abtastrate | Speaker | Kanal | Gesamtstunden | Gesamtzahl der Redner |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2 Lautsprecher | Dual | 117:03:45 | 498 |
| Allgemeine Konversation | 8 kHz | 2 Lautsprecher | Dual | 168:13:39 | 458 |
| Mediendaten | 16 kHz | Mehrere Lautsprecher | Mono | 24:58:58 | 90 |
| Geskripteter Monolog | 24 kHz | Einzelner Lautsprecher | Mono | 2,300:00:00 | Auf Anfrage |
Ausgewählte Kunden
Teams befähigen, weltweit führende KI-Produkte zu entwickeln.
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden