Marathi-Datensatz

मराठी डेटासेट

Hochwertiger Marathi-Callcenter-, allgemeiner Konversations-, geskripteter Monolog- und Medien-(Podcast-)Datensatz für KI- und Sprachmodelle

Übersicht

Titel (Sprache)

Marathi-Sprachdatensatz

Datensatztypen

Callcenter, allgemeine Konversation, Medien (Podcast), geskripteter Monolog

Land

Indien

Beschreibung

Dieser Datensatz umfasst nicht geskriptete synthetische Telefongespräche zwischen Agenten und Kunden (5–15 Minuten), natürliche Telefongespräche von Mensch zu Mensch (15–60 Minuten) und Gesangsaudio mit Transkriptionen und bietet so vielfältige Sprachdaten für das Training und die Bewertung von Sprach- und Sprachtechnologien.

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Call Center 8 kHz 2 Lautsprecher Dual 70:28:58 634
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 159:21:13 298
Mediendaten 16 kHz Multipal-Lautsprecher Mono 24:09:24 94
Geskripteter Monolog 24 kHz Einzelner Lautsprecher Mono 3,900:00:00 Auf Anfrage

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden