Die vertrauenswürdigsten Sprachdatenerfassungsdienste für Ihre KI

Trainieren Sie Ihre NLP-Modelle, VAs, TTS-Prototypen und mehr mit hochwertigen Gesprächsdaten mit unseren Audio- und Sprachdatenerfassungsdiensten

Audiodatenerfassung

Entdecken Sie Audiodaten-Pipelines ohne Engpässe

Ausgewählte Kunden

Professionelle Audio-/Sprachdatenerfassungsdienste

Beliebiges Thema. Jedes Szenario.

Bei Shaip liegt unsere Expertise in der Erstellung hochwertiger Sprachdatensätze, die für unterschiedliche KI/ML-Anforderungen konzipiert sind. Wir bieten ein umfangreiches Spektrum an Sprachen und zeichnen in verschiedenen Umgebungen auf, wodurch unsere Datensätze umfassend und anpassungsfähig sind. ÖUnser Fokus liegt darauf, Modelle mit der größtmöglichen Menge an benutzerdefinierten Sprachdaten in möglichst kurzer Zeit zu versorgen. Mit uns an Bord erwartet Sie: 

Sammlung von Reden
  • Kuratierte hochwertige mehrsprachige Audio-/Sprachdaten zur Verbesserung der Genauigkeit
  • Höchstmögliche Ebene der Domänenspezifität für target vielfältiges Szenario Setup
  •  Skalieren Sie Ihr ML-Modell, um es an verschiedene Demografien und Branchen anzupassen
  • Aufnahmeumgebungen: Studioqualität, mit kristallklarem Audio mit minimalen Hintergrundgeräuschen und Natürliche Umgebungen, bei dem Aufnahmen Umgebungsgeräusche integrieren, um reale Situationen nachzuahmen.

100+

Länder

55 +

Daten zu Sprechstunden

250+

Projekte

60+

Sprachen (über 100 Dialekte)

8 / 16 / 44 / 48 kHz

Abtastrate

Unsere Expertise

Richten Sie Audiodaten für intelligentere NLP-Modelle aus

Shaip bietet End-to-End-Dienste zur Erfassung von Sprach-/Audiodaten in mehr als 100 Sprachen, damit sprachgestützte Technologien ein vielfältiges Publikum auf der ganzen Welt bedienen können. Wir können an Projekten jeder Größenordnung und Größe arbeiten; von der Lizenzierung vorhandener Standard-Audiodatensätze über die Verwaltung der benutzerdefinierten Audiodatensammlung bis hin zur Audiotranskription und Annotation. Egal wie groß Ihr Projekt zur Erfassung von Sprachdaten ist, wir können die Audioerfassungsdienste an Ihre Bedürfnisse anpassen, um hochwertige NLP-Datensätze zu erstellen, die auf Dialekte, Töne und Sprachen abzielen. Wählen Sie aus unserem breiten Angebot an Sprachdatensätzen und Audiodatenerfassungsressourcen für sprachaktivierende intelligente Setups.

Monologrede

Sammlung von Monolog-Reden

Der Schwerpunkt liegt auf der Verarbeitung der Sprache eines einzelnen Sprechers. Nutzen Sie skriptgesteuerte Eingabeaufforderungen zur Einspeisung in einkanalige Audiodateien und stellen Sie so die Erfassung einzigartiger Sprachmuster, Töne und Nuancen sicher, die für diese Person spezifisch sind.

Dialogrede

Dialog Rede
Sammlung

Interaktion mit zwei Personen, Nachbildung realer Gespräche und Dialoge mit mehrsprachiger Darstellung über Dual-Channel-Dateien und transkribierte Ressourcen.

Gespräche mit mehreren Teilnehmern

Gruppe/Muti-Party
Gespräche

Diskussionen mit mehreren Personen, Erfassung von Gruppendynamik, Überschneidungen und unterschiedlichen Tönen, um Sprachmodelle präzise zu trainieren.

Äußerung in natürlicher Sprache

Sammlung natürlicher Sprachäußerungen

Trainieren Sie KIs, um Phrasen zu identifizieren oder Wörter mit ähnlicher Bedeutung zu wecken, indem Sie vielfältige, reichhaltige und authentische Äußerungen für eine erweiterte Verarbeitung und ein besseres Verständnis natürlicher Sprache verwenden.

Akustische Sprache

Akustische Daten
Sammlung

Wir können Audiodaten in Studioqualität professionell aufzeichnen, sei es in Restaurants, Büros oder Privathäusern oder aus verschiedenen Umgebungen und Sprachen, und dabei einen größeren akustischen Bereich abdecken (umfassende Klangdatensätze).

Automatische Spracherkennung

Automatische Spracherkennung (ASR)

Verbessern Sie die Genauigkeit Ihrer automatischen Spracherkennungssysteme (ASR), indem Sie Zugriff auf modernste diversifizierte Sprach-/Audiodatensätze aus einer Vielzahl von Demografien haben.

Äußerung in natürlicher Sprache

Mehrsprachige Sprach-/Audio-Trainingsdaten

Unsere erfahrenen Sprachprofis auf der ganzen Welt bieten mehrsprachige Audio-/Sprachdaten in verschiedenen Sprachen und Dialekten. Diese Bemühungen fördern die globale Kommunikation, überbrücken Sprachbarrieren und tragen so zu integrativeren und effektiveren KI-Lösungen bei.

Digitale virtuelle Assistenten

Text-to-Speech
(TTS)

Erstellen Sie mit Hilfe unserer weltweiten Belegschaft ein mehrsprachiges Text-to-Speech-Modell (TTS), das Ihnen dabei hilft, Sprachdaten in über 150 Sprachen und Dialekten zu sammeln, um Ihre KI-Modelle von Fahrzeugsteuerungen bis hin zu Chatbots und Lernlösungen mit hoher Qualität zu verbessern. hochwertige Audiodaten.

Callcenter-Aufzeichnungen

Call Center
Aufnahmen

Echter Austausch zwischen Agenten und Kunden, unterstützt zahlreiche Sprachen wie Spanisch, Deutsch, amerikanisches Englisch, Bengali, Japanisch, Chinesisch und Hindi.

Erfolgsgeschichten

Konversations-KI-Datensätze mit über 3 Stunden Daten in 8 Sprachen

Auf der Suche nach einer mehrsprachigen Plattform für indische Sprachen arbeitete der Kunde mit Shaip zusammen, um große Datensätze in mehreren indischen Sprachen zu sammeln, zu segmentieren und zu transkribieren. Dies würde dazu beitragen, effektive Sprachmodelle zu entwickeln, die die innovative neue Plattform des Kunden vorantreiben könnten.

Problem: Über 3,000 Stunden Audiodaten wurden in 8 indischen Sprachen gesammelt, segmentiert und transkribiert, um eine automatische Spracherkennung zu entwickeln.

Lösung: Wir haben die Datenerfassung, Segmentierung und Transkription bereitgestellt und JSON-Dateien mit Metadaten bereitgestellt. Für das Sprachtechnologieprojekt des Kunden haben wir 3000 Stunden Audiodaten in 8 indischen Sprachen im großen Maßstab gesammelt.

Fallstudie zur Sprachdatenerfassung

Gründe, Shaip als Ihren vertrauenswürdigen Partner für die Sprachdatenerfassung zu wählen

Personen

Personen

Engagierte und geschulte Teams:

  • 30,000+ Mitarbeiter für Datenerstellung, Kennzeichnung und QA
  • Zertifiziertes Projektmanagement-Team
  • Erfahrenes Produktentwicklungsteam
  • Talentpool-Sourcing- und Onboarding-Team
Prozess

Prozess

Höchste Prozesseffizienz wird gewährleistet durch:

  • Robuster 6-Sigma-Stage-Gate-Prozess
  • Ein engagiertes Team von 6 Sigma Black Belts – Key Process Owners & Quality Compliance
  • Kontinuierliche Verbesserung und Feedbackschleife
Plattform

Plattform

Die patentierte Plattform bietet Vorteile:

  • Webbasierte End-to-End-Plattform
  • Einwandfreie Qualität
  • Schnellere TAT
  • Nahtlose Lieferung

Sprach-/Audio-Datensätze von der Stange

DetailsSprachdatensatzAbtastrateDatensatztypGesamte AudiostundenKurzbeschreibungBeschreibung des DatensatzesAudio-KanalAufzeichnungsplattformWIR SIND (%)Audio FormatTranskriptionsformatLuftüberwachungAnzahl der LautsprecherCTA
Redede_US_CC_8Afroamerikanische UmgangsspracheAfroamerikanische Umgangsspracheen_US8 kHzCall Center211African American Vernacular Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 612, Männlich: 1242 und Unbekannt: 12
Redede_US_MA_16Afroamerikanische UmgangsspracheAfroamerikanische Umgangsspracheen_US16 kHzMedienaudio154Afroamerikanische Vernacular Media-DatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 151, Männlich: 150 und Unbekannt: 10
RedeAfrikaans_GC_8AfrikanischAfrikanischaf_ZA8 kHzAllgemeine Konversation368Daten zu allgemeinen Konversationen in AfrikaansUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Afrikaans wird in Afrika gesprochenDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 502, Männlich: 390 und Unbekannt: 2
RedeAfrikaans_MA_16AfrikanischAfrikanischaf_ZA16 kHzMedienaudio658Afrikaans-MediendateienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 750, Männlich: 1278 und Unbekannt: 52
RedeArabisch_GC_8ArabischArabischar_AE8 kHzAllgemeine Konversation292Arabische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Arabisch aus den GolfstaatenDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 171, Männlich: 534 und Unbekannt: 1
RedeArabisch_SM_48ArabischArabischar-SA48 kHzGeskripteter Monolog1,947Monolog in arabischer SchriftAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 838 Männlich 1209 Unbekannt 78
RedeAssamesisch_CC_8AssameseAssamesisch (in Vorbereitung) wie inCall Center60Assamesische (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeAssamesisch_GCAssameseAssamesisch (in Vorbereitung) wie inAllgemeine Konversation100Allgemeine Konversationsdaten für Assamesisch (in Vorbereitung).Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeAssamesisch_MAAssameseAssamesisch (in Vorbereitung) wie inMedienaudio40Assamesische (in Pipeline) MedienaudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBengali_CC_8BengalischBengalisch (in Vorbereitung) bn_INCall Center60Bengalische (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBengali_GCBengalischBengalisch (in Vorbereitung) bn_INAllgemeine Konversation100Allgemeine Konversationsdaten für Bengali (in Vorbereitung).Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBengali_MABengalischBengalisch (in Vorbereitung) bn_INMedienaudio40Bengali (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBoston_CC_8Boston-EnglischBoston-Englischen_US8 kHzCall Center177Boston Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 605, Männlich: 711 und Unbekannt: 0
RedeBoston_GC_8Boston-EnglischBoston-Englischen_US8 kHzAllgemeine Konversation32Boston General Conversation-DatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 53, Männlich: 83 und Unbekannt: 0
RedeBoston_MA_16Boston-EnglischBoston-Englischen_US16 kHzMedienaudio93Audiodaten von Boston MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 43, Männlich: 181 und Unbekannt: 2
RedeKanadier_SM_48Kanadisches FranzösischKanadisches Französischfr-CA48 kHzGeskripteter Monolog1,222Kanadisches FranzösischAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 974 Männlich 631 Unbekannt 1
RedeChinesisch_CC_8Chinesisch EnglischChinesisch Englischen_US8 kHzCall Center169Chinesische Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 1790, Männlich: 523 und Unbekannt: 13
RedeChinesisch_MA_16Chinesisch EnglischChinesisch Englischen_US16 kHzMedienaudio249Audiodaten von chinesischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 126, Männlich: 346 und Unbekannt: 6
RedeChinesisch vereinfacht_SM_48Chinesisch vereinfachtChinesisch vereinfachtzh-CN48 kHzGeskripteter Monolog2,762Chinesisch vereinfachtAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1920 Männlich 1535 Unbekannt 270
RedeTraditionelles Chinesisch_SM_48Traditionelles ChinesischTraditionelles Chinesischzh-TW48 kHzGeskripteter Monolog1,028Traditionelles ChinesischAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1069 Männlich 262 Unbekannt 3
RedeDänisch_GC_8DänischDänischda_DK8 kHzAllgemeine Konversation372Dänische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 311, Männlich: 417, Unbekannt: 0
RedeDänisch_MA_16DänischDänischda_DK16 kHzMedienaudio664Audiodaten von Danish MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 369, Männlich: 864, Unbekannt: 27
RedeDänisch_SM_48DänischDänischda-DK48 kHzGeskripteter Monolog2,579Dänischer geschriebener MonologAufnahmen mit einer einzigen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallen, Dänisch aus DänemarkMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1551 Männlich 1233 Unbekannt 42
RedeEnglisch Deep South_CC_8Englisch Tiefer SüdenEnglisch Tiefer Südenen_US8 kHzCall Center151Englisch Deep South Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 221 , Männlich 1004 , Unbekannt 7
RedeEnglisch Deep South_GC_8Englisch Tiefer SüdenEnglisch Tiefer Südenen_US8 kHzAllgemeine Konversation56Englisch Deep South Allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 99, Männlich 31, Unbekannt 0
RedeEnglisch Deep South_MA_16Englisch Tiefer SüdenEnglisch Tiefer Südenen_US16 kHzMedienaudio266Englisch Deep South Media AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 204, Männlich 356, Unbekannt 21
RedeDeutsch_CC_8DeutschDeutschde-De8 kHzCall Center64Deutsche Call-Center-Daten Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,MonoDesktop. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 478 Männlich 1440 Unbekannt 0
RedeDeutsch_IVR_8DeutschDeutschde-De8 kHz IVR200Deutsche IVR-DatenMensch zu Maschine. Ein IVR-Flow, bei dem eine TTS-Eingabeaufforderung (z. B. „Wie kann ich Ihnen helfen“) gefolgt von einer spontanen menschlichen Antwort erfolgtMonoDesktop. Wav .jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung Weiblich 10115 Männlich 8750 Unbekannt 0
RedeGujarati_CC_8GujaratiGujarati (in Vorbereitung) gu_INCall Center60Gujarati (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeGujarati_GCGujaratiGujarati (in Vorbereitung) gu_INAllgemeine Konversation100Gujarati (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeGujarati_MAGujaratiGujarati (in Vorbereitung) gu_INMedienaudio40Gujarati (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeHebräisch_Allgemeines Gespräch_8HebräischHebräischer_IL8 kHzAllgemeine Konversation399Hebräische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Hebräisch in IsraelDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 414 , Männlich 399 , Unbekannt 1
RedeHebräisch_MA_16HebräischHebräischer_IL16 kHzMedienaudio427Audiodaten von hebräischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungFrau 361, Mann 513, Unbekannt 13
RedeHindi_MA_16HindiHindihi_IN16 kHzMedienaudio219Audiodaten von Hindi MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungFrau 83, Mann 309, Unbekannt 0
RedeHindi_SM_48HindiHindiHallo-IN48 kHzGeskripteter Monolog2,867Hindi geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1977 Männlich 1864 Unbekannt 147
RedeHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCall Center208HINGLISH Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 822, Männlich 1262 , Unbekannt 0
RedeHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedienaudio216HINGLISH MedienaudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 75, Männlich 380, Unbekannt 0
RedeSpanisch_CC_8Hispanisches EnglischHispanisches Englischen_US8 kHzCall Center212Hispanic Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 822, Männlich 1262, Unbekannt 0
RedeSpanisch_MA_16Hispanisches EnglischHispanisches Englischen_US16 kHzMedienaudio155Hispanic Call Media-AudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 140, Männlich 219, Unbekannt 5
RedeIndonesisch_GC_8IndonesianIndonesianid_ID8 kHzAllgemeine Konversation496Indonesische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Bahasa-IndonesischDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 524, Männlich 454, Unbekannt 2
RedeIndonesisch_MA_16IndonesianIndonesianid_ID16 kHzMedienaudio643Audiodaten der indonesischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 746, Männlich 1507, Unbekannt 129
RedeIrish_GC_8irischirischde_IE8 kHzAllgemeine Konversation192Daten zu irischen allgemeinen GesprächenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 213 , Männlich 153 , Unbekannt 0
RedeJapanisch_SM_48JapanischJapanischja-JP48 kHzGeskripteter Monolog2,335Japanischer geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1460 Männlich 1221 Unbekannt 194
RedeKannada_CC_8kannadaKannada (in Vorbereitung) kn_INCall Center60Kannada (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeKannada_GCkannadaKannada (in Vorbereitung) kn_INAllgemeine Konversation100Kannada (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeKannada_MAkannadaKannada (in Vorbereitung) kn_INMedienaudio40Kannada (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeKoreanisch_CC_8KoreanischKoreanischko_KR8 kHzCall Center107Koreanische Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1086, Männlich 210, Unbekannt 4
RedeKoreanisch_MA_16KoreanischKoreanischko_KR16 kHzMedienaudio204Audiodaten für koreanische MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 70 Männlich 303, Unbekannt 25
RedeKoreanisch_SM_48KoreanischKoreanischko-KR48 kHzGeskripteter Monolog1,955Koreanisch geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1195 Männlich 1134 Unbekannt 122
RedeMalaiisch_GC_8MalayMalayms_MY8 kHzAllgemeine Konversation266Malaiische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Malaiisch in MalaysiaDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 316, Männlich 176 , Unbekannt 0
RedeMalaiisch_MA_16MalayMalayms_MY16 kHzMedienaudio344Audiodaten von Malay MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 236, Männlich 626, Unbekannt 47
RedeMalayalam_CC_8MalayalamMalayalam (in Vorbereitung) ml_INCall Center60Malayalam (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMalayalam_GCMalayalamMalayalam (in Vorbereitung) ml_INAllgemeine Konversation100Malayalam (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMalayalam_MAMalayalamMalayalam (in Vorbereitung) ml_INMedienaudio40Malayalam (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMarathi_CC_8MarathiMarathi (in Vorbereitung) mr_INCall Center60Marathi (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMarathi_GCMarathiMarathi (in Vorbereitung) mr_INAllgemeine Konversation100Marathi (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMarathi_MAMarathiMarathi (in Vorbereitung) mr_INMedienaudio40Marathi (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMexikaner_SM_48Spanisch (Mexiko)Spanisch (Mexiko)es-MX48 kHzGeskripteter Monolog1,492Mexikanisch-Spanisch geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1016 Männlich 1069 Unbekannt 95
RedeNiederlande_SM_48NiederländischNiederländischnl-NL48 kHzGeskripteter Monolog1,205Niederländischer geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1285 Männlich 531 Unbekannt 3
RedeNew York Englisch_CC_8New Yorker EnglischNew Yorker Englischen_US8 kHzCall Center103New York English Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 610, Männlich 532, Unbekannt 0
RedeNew York Englisch_GC_8New Yorker EnglischNew Yorker Englischen_US8 kHzAllgemeine Konversation107New York English General Conversation-DatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 118, Männlich 114, Unbekannt 0
RedeNew York Englisch_MA_16New Yorker EnglischNew Yorker Englischen_US16 kHzMedienaudio140Audiodaten von New York English MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 66, Männlich 230, Unbekannt 11
RedeNeuseeland_GC_8Neuseeland Englisch Neuseeland Englisch de_NZ8 kHzAllgemeine Konversation148Allgemeine Konversationsdaten für neuseeländisches EnglischUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 167, Männlich 121, Unbekannt 4
RedeNeuseeland_MA_16Neuseeland Englisch Neuseeland Englisch de_NZ16 kHzMedienaudio400Neuseeländisches englisches MedienaudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 367, Männlich 678, Unbekannt 26
RedeOriya_CC_8OriyaOriya (in Vorbereitung) oder_INCall Center60Oriya (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeOriya_GCOriyaOriya (in Vorbereitung) oder_INAllgemeine Konversation100Oriya (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeOriya_MAOriyaOriya (in Vorbereitung) oder_INMedienaudio40Oriya (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedePolnisch_MA_16PolnischPolnischpl_PL16 kHzMedienaudio269Polnische Medien AudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierungweiblich 173 männlich 354 unbekannt 6
RedePolnisch Poland_SM_48Polnisch (Polen)Polnisch (Polen)pl-PL48 kHzGeskripteter Monolog1,482Polnisches Polen - Geskripteter MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1324 Männlich 701 Unbekannt 24
RedePunjabi_CC_8PandschabiPunjabi (in Vorbereitung) PandschabiCall Center60Punjabi (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedePunjabi_GCPandschabiPunjabi (in Vorbereitung) PandschabiAllgemeine Konversation100Punjabi (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedePunjabi_MAPandschabiPunjabi (in Vorbereitung) Pandschabi Medienaudio40Punjabi (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeRussisch_SM_48RussischRussischru-RU48 kHzGeskripteter Monolog2,398Russischer geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1689 Männlich 1937 Unbekannt 214
RedeSchottisch_GC_8Schottisch (englischer Akzent)Schottisch (englischer Akzent)de_AB8 kHzAllgemeine Konversation292Schottische General Conversation-DatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungFrau 285, Mann 260, Unbekannt 3
RedeSingapur_CC_8Singapur englischSingapur englischde_SG8 kHzCall Center218Call-Center-Daten aus SingapurUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 2139, Männlich 884, Unbekannt 21
RedeSingapur_MA_16Singapur englischSingapur englischde_SG16 kHzMedienaudio247Audiodaten von Singapore MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 160, Männlich 455, Unbekannt 37
RedeSüdafrikanisches Englisch_CC_8Südafrikanisches EnglischSüdafrikanisches Englischde_ZA8 kHzCall Center261South African English Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1274 , Männlich 935 , Unbekannt 1
RedeSüdafrikanisches Englisch_MA_16Südafrikanisches EnglischSüdafrikanisches Englischde_ZA16 kHzMedienaudio251Audiodaten von südafrikanischen englischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 235, Männlich 432, Unbekannt 36
RedeSuaheli_CC_8SuaheliSuahelisw_KE8 kHzCall Center230Suaheli Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 611, Männlich 833, Unbekannt 0
RedeSuaheli_MA_16SuaheliSuahelisw_KE16 kHzMedienaudio265Audiodaten von Swahili MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 118, Männlich 493, Unbekannt 25
RedeSchwedisch_CC_8SchwedischSchwedischsv_SE8 kHzCall Center250Schwedische Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeibchen 1581, Männchen 727, Unbekannt 2
RedeSchwedisch_MA_16SchwedischSchwedischsv_SE16 kHzMedienaudio278Audiodaten der schwedischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeibchen 195, Männchen 500, Unbekannt 21
RedeTamilisch_CC_8TamilischTamilisch (in Vorbereitung) ta_INCall Center60Tamilische (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTamil_GCTamilischTamilisch (in Vorbereitung) ta_INAllgemeine Konversation100Allgemeine Konversationsdaten für Tamil (in Vorbereitung).Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTamil_MATamilisch Tamilisch (in Vorbereitung) ta_INMedienaudio40Tamilische (in Vorbereitung) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTelugu_GC_8TeluguTelugute_IN8 kHzAllgemeine Konversation553Telugu Allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 574, Männlich 564, Unbekannt 0
RedeTelugu_MA_16TeluguTelugute_IN16 kHzMedienaudio648Audiodaten von Telugu MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 207, Männlich 963, Unbekannt 2
RedeTelugu_CC_8TeluguTelugu (in Vorbereitung) te_INCall Center30Telugu (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTelugu_GCTeluguTelugu (in Vorbereitung) te_INAllgemeine Konversation50Telugu (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTelugu_MATeluguTelugu (in Vorbereitung) te_INMedienaudio20Telugu (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeThai_GC_8ThaiThaith_TH8 kHzAllgemeine Konversation183Thai allgemeine KonversationUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Ein informelles Register, das zwischen Freunden verwendet wirdDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 338, Männlich 96, Unbekannt 8
RedeThai_MA_8ThaiThaith_TH16 kHzMedienaudio173Thai Media-AudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 143, Männlich 502, Unbekannt 26
RedeTürkische Türkei_SM_48Türkische TürkeiTürkische Türkeitr-TR48 kHzGeskripteter Monolog2,027Türkische TürkeiAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1561 Männlich 1241 Unbekannt 31
RedeVietnamesisch_GC_8VietnamesischVietnamesischde_VN8 kHzAllgemeine Konversation295Daten zur vietnamesischen allgemeinen KonversationUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten, Nord (z. B. Hanoi), Zentral und Süd (z. B. Ho-Chi-Minh-Stadt).DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 400, Männlich 380, Unbekannt 2
RedeVietnamesisch_MA_16VietnamesischVietnamesischde_VN16 kHzMedienaudio257Audiodaten von vietnamesischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 249, Männlich 200, Unbekannt 45
RedeWalisisch_GC_8Walisisch (englischer Akzent)Walisisch (englischer Akzent)de_WL8 kHzAllgemeine Konversation278Walisische allgemeine KonversationsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 270, Männlich 324, Unbekannt 0
RedeBritisches Englisch_WW_16UK EnglishUK Englishen_uk16 kHzWort wecken200 LautsprecherWake Word UK EnglischStichwort Sammlung von Daten
  • 200 Lautsprecher
  • 4 eindeutige Schlüsselphrasen pro Lautsprecher
  • 25-30 wiederholte Keyphrase-Aufnahmen pro einzigartigem Keyphrase
  • 25-30 Audiodateien pro eindeutiger Schlüsselphrase
  • Insgesamt 120 aufgezeichnete Äußerungen pro Sprecher
1 KanalApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungGeschlecht: 50 % männlich, 50 % weiblich, +/- 10 %.

Dienstleistungen angeboten

Die fachmännische Audiodatenerfassung ist für umfassende KI-Setups nicht nur praktisch. Bei Shaip können Sie sogar die folgenden Dienste in Betracht ziehen, um Modelle weit verbreiteter als üblich zu machen:

Textdatenerfassung

Erfassung von Textdaten
Leistungen

Der wahre Wert der kognitiven Datenerfassungsdienste von Shaip besteht darin, dass sie Unternehmen den Schlüssel zur Erschließung kritischer Informationen in unstrukturierten Daten liefern

Bilddatenerfassung

Bilddatenerfassungsdienste

Stellen Sie sicher, dass Ihr Computer-Vision-Modell jedes Bild genau identifiziert, um die KI-Modelle der nächsten Generation der Zukunft nahtlos zu trainieren

Videodatenerfassung

Dienste zur Erfassung von Videodaten

Konzentrieren Sie sich jetzt auf Computer Vision zusammen mit NLP, um Ihre Modelle zu trainieren, um Objekte, Personen, Abschreckungsmittel und andere visuelle Elemente perfekt zu identifizieren

Shaip kontaktieren Sie uns

Möchten Sie Ihren eigenen Audiodatensatz erstellen?

Wenden Sie sich an unseren internen Experten für Sprachdatenerfassung, um ein Audio-Repository einzurichten, das Ihren Anforderungen am besten entspricht

  • Mit der Registrierung stimme ich Shaip zu Datenschutz und Nutzungsbedingungen und erteile meine Zustimmung zum Erhalt von B2B-Marketingkommunikation von Shaip.

Unter Sprachdatenerfassung für ein ML-Modell versteht man den Prozess der Erfassung von Audioaufzeichnungen gesprochener Sprache. Diese Sammlung hilft beim Trainieren und Verfeinern von Algorithmen für maschinelles Lernen, insbesondere von solchen, die sich auf das Verstehen und Verarbeiten menschlicher Stimmen konzentrieren.

Wenn Sie Audiodaten für die automatische Spracherkennung (ASR) sammeln möchten, sollten Sie zunächst die spezifischen Anforderungen Ihres Projekts definieren, einschließlich der gewünschten Sprache, des Akzents und der Art der Sprache. Stellen Sie nach dem Festlegen dieser Parameter sicher, dass Sie alle erforderlichen Berechtigungen erhalten, um die Privatsphäre der Benutzer zu respektieren. Verwenden Sie dann geeignete Aufnahmegeräte oder Software, um klare Audiobeispiele aufzunehmen. Jede Aufnahme sollte sorgfältig mit ihrer Transkription oder anderen relevanten Metadaten versehen und systematisch gespeichert werden, um einen mühelosen Zugriff zu ermöglichen.

Ein Sprachdatensatz beim maschinellen Lernen ist von entscheidender Bedeutung für das Training, Testen und Validieren von Modellen, die auf die Erkennung, Transkription oder Interpretation gesprochener Sprache zugeschnitten sind. Solche Datensätze ebnen den Weg für eine Vielzahl von Anwendungen, von Sprachassistenten und Transkriptionsdiensten bis hin zur Stimmbiometrie.

Um präzise Daten aus verschiedenen Sprachen und Akzenten zu sammeln, ist die Zusammenarbeit mit Muttersprachlern mit dem gewünschten sprachlichen Hintergrund von entscheidender Bedeutung. Streben Sie eine vielfältige und repräsentative Stichprobe an, um ein breites Spektrum demografischer Nuancen abzudecken. Setzen Sie standardisierte Aufnahmegeräte in einheitlichen Umgebungen ein, um die Audiokonsistenz sicherzustellen. Und was noch wichtiger ist: Kommentieren Sie jedes Datenelement mit detaillierten Transkriptionen und Metadaten und geben Sie dabei die spezifische Sprache und den Akzent an.