Malayalam-Datensatz

മലയാളം ഡാറ്റാസെറ്റ്

Hochwertiger Malayalam-Datensatz für allgemeine Gespräche und Podcasts für KI- und Sprachmodelle

Übersicht

Titel (Sprache)

Malayalam-Sprachdatensatz

Datensatztypen

Allgemeine Konversation, Mediendaten (Podcast)

Land

Indien

Beschreibung

Dieser Datensatz enthält nicht geskriptete synthetische Telefongespräche zwischen einem Agenten und einem Kunden (5–15 Minuten) und lizenzierbare gemeinfreie Audio- oder Videodateien, wie Interviews und Podcasts mit 1 bis 5 Teilnehmern (15–60 Minuten).

Luftüberwachung

ASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung

Datensatzdetails

Datensatztyp Abtastrate Speaker Kanal Gesamtstunden Gesamtzahl der Redner
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 70:46:30 576
Allgemeine Konversation 8 kHz 2 Lautsprecher Dual 149:39:33 296
Mediendaten 16 kHz Mehrere Lautsprecher Mono 12:39:24 81

Ausgewählte Kunden

Teams befähigen, weltweit führende KI-Produkte zu entwickeln.

Amazon
Google
Microsoft
Shaip kontaktieren Sie uns

Können Sie nicht finden, wonach Sie suchen?

Über alle Datentypen hinweg werden neue Standard-Datensätze gesammelt

Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Audio-/Sprachtrainingsdaten loszuwerden

  • Dieses Feld ist für die Zwecke der Validierung und sollten unverändert bleiben.
  • Mit der Registrierung stimme ich Shaip zu Datenschutzerklärung kombiniert mit einem nachhaltigen Materialprofil. Nutzungsbedingungen und erteile meine Zustimmung zum Erhalt von B2B-Marketingkommunikation von Shaip.