Die vertrauenswürdigsten Sprachdatenerfassungsdienste für Ihre KIs

Trainieren Sie Ihre NLP-Modelle, VAs, TTS-Prototypen und mehr mit hochwertigen Gesprächsdaten mit unseren Audio- und Sprachdatenerfassungsdiensten

Audiodatensammlung

Entdecken Sie Audiodaten-Pipelines ohne Engpässe.

Ausgewählte Kunden

Warum wird ein Sprachtrainingsdatensatz für die Verarbeitung natürlicher Sprache benötigt?

Haben Sie jemals bemerkt, dass Ihre Smartphone-VA, dh Siri, Bixby oder etwas anderes, interagiert? Die Art und Weise, wie sie jede Frage beantworten und Ergebnisse nach Ihren Anforderungen analysieren und präsentieren!

Nun, so sehr uns diese VAs faszinieren, diese intelligenten Ressourcen und Programme müssen schrittweise trainiert werden, um so genau reagieren zu können. Aus diesem Grund sollten Sie erwägen, die Sprach-/Audio- und Sprachdatenerfassung an spezialisierte Datenerfassungsunternehmen mit validiertem Fachwissen auszulagern.

Die Investition in die Audiodatenerfassung bereitet Ihr angebliches NLP darauf vor, ein mehrsprachiges Publikum anzusprechen. Nicht nur das, die Sprachdatenerfassung für NLP, wenn sie von einem Experten durchgeführt wird, berücksichtigt sogar die Erfassung vor Ort, die semantische Analyse und die Audiotranskription. Mit professionellen Sprachdatenerfassungslösungen können Sie:

  • Beschaffen Sie hochwertige Audiodatensätze, um die Genauigkeit zu verbessern
  • Zielen Sie auf ein vielfältiges Szenario-Setup
  • Sammeln Sie mehrsprachige KI-Trainingsdaten
  • Skalieren Sie Ihr ML-Modell, um es an verschiedene Demografien und Branchen anzupassen

Professionelle Audio-/Sprachdatenerfassungsdienste für NLP

Beliebiges Thema. Jedes Szenario.

Intelligente NLP-Systeme sind alles andere als generisch. Abhängig von der Funktionalität des Programms müssen Sie sich möglicherweise auf räumliche und mehrsprachige Audiodatendienste konzentrieren, die nur von renommierten Sprach-/Audiodatenerfassungsunternehmen angeboten werden können. Hier kommt Shaip als äußerst zuverlässiger Datenverbindungsdienstleister ins Spiel, der stolz darauf ist, die Schwerstarbeit für Ihre vermeintlich intelligenten KIs zu übernehmen.

Bei Shaip liegt unser Hauptaugenmerk darauf, Modelle mit dem höchstmöglichen Volumen an benutzerdefinierten Sprachproben in kürzester Zeit zu füttern. Bei uns an Bord erwartet Sie:

Sprachsammlung
  • Kuratierte Audio-/Sprachdatensammlung für NLP
  • Maßgeschneiderte Programme, die auf spezifische Anwendungsfälle reagieren
  • Vorbereitung für das Mining von Audiodatensätzen
  • Musterspezifische und automatisierte Datenverarbeitung
  • Höchstmögliche Domänenspezifität
  • Schnellere Markteinführung mit beschleunigten KI-Modellen

Unsere Expertise

Audiodaten ausrichten, um intelligente NLP-Modelle vorzubereiten

Shaip bietet End-to-End-Dienste zur Erfassung von Sprach-/Audiodaten in mehr als 100 Sprachen, damit sprachgestützte Technologien ein vielfältiges Publikum auf der ganzen Welt bedienen können. Wir können an Projekten jeder Größenordnung und Größe arbeiten; von der Lizenzierung vorhandener Standard-Audiodatensätze über die Verwaltung der benutzerdefinierten Audiodatensammlung bis hin zur Audiotranskription und Annotation. Egal wie groß Ihr Projekt zur Erfassung von Sprachdaten ist, wir können die Audioerfassungsdienste an Ihre Bedürfnisse anpassen, um hochwertige NLP-Datensätze zu erstellen, die auf Dialekte, Töne und Sprachen abzielen. Wählen Sie aus unserem breiten Angebot an Sprachdatensätzen und Audiodatenerfassungsressourcen für sprachaktivierende intelligente Setups.

Monolog Rede

Sammlung von Monolog-Reden

Bewältigen Sie sprachbasierte Anforderungen an einen eigenständigen Lautsprecher für Ihre Text-to-Speed-Prototypen und transkriptionsspezifische Anforderungen mit skriptgesteuerter Eingabeaufforderung über Einkanaldateien.

Dialog Rede

Dialog Rede
Kollektion

Richten Sie intelligente virtuelle Assistenten, geschwindigkeitsspezifische Chatbots und Modelle zur automatischen Spracherkennung mit mehrsprachiger Darstellung über Zweikanaldateien und transkribierte Ressourcen ein.

Akustische Sprache

Akustische Daten
Kollektion

Wir können Audiodaten in Studioqualität professionell aufnehmen, sei es in Restaurants, Büros oder zu Hause oder aus verschiedenen Umgebungen und Sprachen, über unser globales Netzwerk von Mitarbeitern, während ein breiterer akustischer Bereich abgedeckt wird

Natürliche Sprachäußerung

Sammlung natürlicher Sprachäußerungen

Trainieren Sie intelligente kommerzielle Setups, um unterschiedlich geäußerte Kundenphrasen mit ähnlicher Bedeutung zu identifizieren, um die KIs rechtzeitig autonomer zu machen

Digitale virtuelle Assistenten

Digital / Virtuell
Assistants

Konzentrieren Sie sich auf den Aufbau Ihres zukünftigen virtuellen Assistenten, indem Sie Modelle mit Einschränkungen der menschlichen Sprache, mehrsprachiger Exposition, Kontextanalyse und NLU trainieren.

Automatische Spracherkennung

Automatische Spracherkennung (ASR)

Verbessern Sie die Genauigkeit Ihrer automatischen Spracherkennungssysteme (ASR), indem Sie Zugriff auf modernste diversifizierte Sprach-/Audiodatensätze aus einer Vielzahl von Demografien haben.

Natürliche Sprachäußerung

Mehrsprachige Sprach-/Audio-Trainingsdaten

Unsere hochqualifizierten Sprachexperten auf der ganzen Welt bieten mehrsprachige Audio-/Sprachtrainingsdaten in mehreren Sprachen und Dialekten, darunter Arabisch, Dänisch, Chinesisch, Afrikaans, Singapur, Neuseeland, Hebräisch, Indonesisch, Irisch, Koreanisch, Malaiisch, Polnisch, Schottisch, Schwedisch , Französisch, Deutsch, Vietnamesisch, Thailändisch, Italienisch, Spanisch und mehr.

Digitale virtuelle Assistenten

Text-to-Speech
(TTS)

Um eine bessere Benutzererfahrung mit TTS zu bieten, ist die Entwicklung eines Systems, das natürlich klingt, von entscheidender Bedeutung. Erstellen Sie ein mehrsprachiges Text-to-Speech (TTS)-Modell mit Hilfe unserer globalen Mitarbeiter, die Ihnen helfen, Sprachdaten in über 150 Sprachen und Dialekten zu sammeln, um Ihre KI-Modelle von Fahrzeugsteuerungen bis hin zu Chatbots und Lernlösungen mit hoch- hochwertige Audiodaten.

Gründe, Shaip als Ihren vertrauenswürdigen Partner für die Sprachdatenerfassung zu wählen

Personen

Personen

Engagierte und geschulte Teams:

  • 30,000+ Mitarbeiter für Datenerstellung, Kennzeichnung und QA
  • Zertifiziertes Projektmanagement-Team
  • Erfahrenes Produktentwicklungsteam
  • Talentpool-Sourcing- und Onboarding-Team
Prozess

Prozess

Höchste Prozesseffizienz wird gewährleistet durch:

  • Robuster 6-Sigma-Stage-Gate-Prozess
  • Ein engagiertes Team von 6 Sigma Black Belts – Key Process Owners & Quality Compliance
  • Kontinuierliche Verbesserung und Feedbackschleife
Plattform

Plattform

Die patentierte Plattform bietet Vorteile:

  • Webbasierte End-to-End-Plattform
  • Einwandfreie Qualität
  • Schnellere TAT
  • Nahtlose Lieferung

Sprache: Gesammelte Audiodatensätze

Sprach-/Audio-Datensätze von der Stange

Alle anzeigenSprachdatensatzAbtastrateDatensatztypGesamte AudiostundenKurzbeschreibungBeschreibung des DatensatzesAudio-KanalAufzeichnungsplattformWIR SIND (%)Audio FormatTranskriptionsformatAnwendungsfallAnzahl der LautsprecherCTA
Redede_US_CC_8Afroamerikanische UmgangsspracheAfroamerikanische Umgangsspracheen_US8 kHzCall Center211African American Vernacular Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 612, Männlich: 1242 und Unbekannt: 12
Redede_US_MA_16Afroamerikanische UmgangsspracheAfroamerikanische Umgangsspracheen_US16 kHzMedienaudio154Afroamerikanische Vernacular Media-DatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 151, Männlich: 150 und Unbekannt: 10
RedeAfrikaans_GC_8AfrikanischAfrikanischaf_ZA8 kHzAllgemeine Konversation368Daten zu allgemeinen Konversationen in AfrikaansUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Afrikaans wird in Afrika gesprochenDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 502, Männlich: 390 und Unbekannt: 2
RedeAfrikaans_MA_16AfrikanischAfrikanischaf_ZA16 kHzMedienaudio658Afrikaans-MediendateienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 750, Männlich: 1278 und Unbekannt: 52
RedeArabisch_GC_8ArabischArabischar_AE8 kHzAllgemeine Konversation292Arabische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Arabisch aus den GolfstaatenDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 171, Männlich: 534 und Unbekannt: 1
RedeArabisch_SM_48ArabischArabischar-SA48 kHzGeskripteter Monolog1,947Monolog in arabischer SchriftAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 838 Männlich 1209 Unbekannt 78
RedeAssamesisch_CC_8AssameseAssamesisch (in Vorbereitung) wie inCall Center60Assamesische (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeAssamesisch_GCAssameseAssamesisch (in Vorbereitung) wie inAllgemeine Konversation100Allgemeine Konversationsdaten für Assamesisch (in Vorbereitung).Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeAssamesisch_MAAssameseAssamesisch (in Vorbereitung) wie inMedienaudio40Assamesische (in Pipeline) MedienaudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBengali_CC_8BengalischBengalisch (in Vorbereitung) bn_INCall Center60Bengalische (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBengali_GCBengalischBengalisch (in Vorbereitung) bn_INAllgemeine Konversation100Allgemeine Konversationsdaten für Bengali (in Vorbereitung).Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBengali_MABengalischBengalisch (in Vorbereitung) bn_INMedienaudio40Bengali (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeBoston_CC_8Boston-EnglischBoston-Englischen_US8 kHzCall Center177Boston Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 605, Männlich: 711 und Unbekannt: 0
RedeBoston_GC_8Boston-EnglischBoston-Englischen_US8 kHzAllgemeine Konversation32Boston General Conversation-DatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 53, Männlich: 83 und Unbekannt: 0
RedeBoston_MA_16Boston-EnglischBoston-Englischen_US16 kHzMedienaudio93Audiodaten von Boston MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 43, Männlich: 181 und Unbekannt: 2
RedeKanadier_SM_48Kanadisches FranzösischKanadisches Französischfr-CA48 kHzGeskripteter Monolog1,222Kanadisches FranzösischAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 974 Männlich 631 Unbekannt 1
RedeChinesisch_CC_8Chinesisch EnglischChinesisch Englischen_US8 kHzCall Center169Chinesische Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 1790, Männlich: 523 und Unbekannt: 13
RedeChinesisch_MA_16Chinesisch EnglischChinesisch Englischen_US16 kHzMedienaudio249Audiodaten von chinesischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 126, Männlich: 346 und Unbekannt: 6
RedeChinesisch vereinfacht_SM_48Chinesisch vereinfachtChinesisch vereinfachtzh-CN48 kHzGeskripteter Monolog2,762Chinesisch vereinfachtAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1920 Männlich 1535 Unbekannt 270
RedeTraditionelles Chinesisch_SM_48Traditionelles ChinesischTraditionelles Chinesischzh-TW48 kHzGeskripteter Monolog1,028Traditionelles ChinesischAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1069 Männlich 262 Unbekannt 3
RedeDänisch_GC_8DänischDänischda_DK8 kHzAllgemeine Konversation372Dänische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 311, Männlich: 417, Unbekannt: 0
RedeDänisch_MA_16DänischDänischda_DK16 kHzMedienaudio664Audiodaten von Danish MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich: 369, Männlich: 864, Unbekannt: 27
RedeDänisch_SM_48DänischDänischda-DK48 kHzGeskripteter Monolog2,579Dänischer geschriebener MonologAufnahmen mit einer einzigen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallen, Dänisch aus DänemarkMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1551 Männlich 1233 Unbekannt 42
RedeEnglisch Deep South_CC_8Englisch Tiefer SüdenEnglisch Tiefer Südenen_US8 kHzCall Center151Englisch Deep South Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 221 , Männlich 1004 , Unbekannt 7
RedeEnglisch Deep South_GC_8Englisch Tiefer SüdenEnglisch Tiefer Südenen_US8 kHzAllgemeine Konversation56Englisch Deep South Allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 99, Männlich 31, Unbekannt 0
RedeEnglisch Deep South_MA_16Englisch Tiefer SüdenEnglisch Tiefer Südenen_US16 kHzMedienaudio266Englisch Deep South Media AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 204, Männlich 356, Unbekannt 21
RedeDeutsch_CC_8DeutschDeutschde-De8 kHzCall Center64Deutsche Call-Center-Daten Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,MonoDesktop. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 478 Männlich 1440 Unbekannt 0
RedeDeutsch_IVR_8DeutschDeutschde-De8 kHz IVR200Deutsche IVR-DatenMensch zu Maschine. Ein IVR-Flow, bei dem eine TTS-Eingabeaufforderung (z. B. „Wie kann ich Ihnen helfen“) gefolgt von einer spontanen menschlichen Antwort erfolgtMonoDesktop. Wav .jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung Weiblich 10115 Männlich 8750 Unbekannt 0
RedeGujarati_CC_8GujaratiGujarati (in Vorbereitung) gu_INCall Center60Gujarati (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeGujarati_GCGujaratiGujarati (in Vorbereitung) gu_INAllgemeine Konversation100Gujarati (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeGujarati_MAGujaratiGujarati (in Vorbereitung) gu_INMedienaudio40Gujarati (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeHebräisch_Allgemeines Gespräch_8HebräischHebräischer_IL8 kHzAllgemeine Konversation399Hebräische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Hebräisch in IsraelDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 414 , Männlich 399 , Unbekannt 1
RedeHebräisch_MA_16HebräischHebräischer_IL16 kHzMedienaudio427Audiodaten von hebräischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungFrau 361, Mann 513, Unbekannt 13
RedeHindi_MA_16HindiHindihi_IN16 kHzMedienaudio219Audiodaten von Hindi MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungFrau 83, Mann 309, Unbekannt 0
RedeHindi_SM_48HindiHindiHallo-IN48 kHzGeskripteter Monolog2,867Hindi geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1977 Männlich 1864 Unbekannt 147
RedeHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCall Center208HINGLISH Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 822, Männlich 1262 , Unbekannt 0
RedeHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedienaudio216HINGLISH MedienaudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 75, Männlich 380, Unbekannt 0
RedeSpanisch_CC_8Hispanisches EnglischHispanisches Englischen_US8 kHzCall Center212Hispanic Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 822, Männlich 1262, Unbekannt 0
RedeSpanisch_MA_16Hispanisches EnglischHispanisches Englischen_US16 kHzMedienaudio155Hispanic Call Media-AudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 140, Männlich 219, Unbekannt 5
RedeIndonesisch_GC_8IndonesianIndonesianid_ID8 kHzAllgemeine Konversation496Indonesische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Bahasa-IndonesischDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 524, Männlich 454, Unbekannt 2
RedeIndonesisch_MA_16IndonesianIndonesianid_ID16 kHzMedienaudio643Audiodaten der indonesischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 746, Männlich 1507, Unbekannt 129
RedeIrish_GC_8irischirischde_IE8 kHzAllgemeine Konversation192Daten zu irischen allgemeinen GesprächenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 213 , Männlich 153 , Unbekannt 0
RedeJapanisch_SM_48JapanischJapanischja-JP48 kHzGeskripteter Monolog2,335Japanischer geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1460 Männlich 1221 Unbekannt 194
RedeKannada_CC_8kannadaKannada (in Vorbereitung) kn_INCall Center60Kannada (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeKannada_GCkannadaKannada (in Vorbereitung) kn_INAllgemeine Konversation100Kannada (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeKannada_MAkannadaKannada (in Vorbereitung) kn_INMedienaudio40Kannada (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeKoreanisch_CC_8KoreanischKoreanischko_KR8 kHzCall Center107Koreanische Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1086, Männlich 210, Unbekannt 4
RedeKoreanisch_MA_16KoreanischKoreanischko_KR16 kHzMedienaudio204Audiodaten für koreanische MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 70 Männlich 303, Unbekannt 25
RedeKoreanisch_SM_48KoreanischKoreanischko-KR48 kHzGeskripteter Monolog1,955Koreanisch geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1195 Männlich 1134 Unbekannt 122
RedeMalaiisch_GC_8MalayMalayms_MY8 kHzAllgemeine Konversation266Malaiische allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Malaiisch in MalaysiaDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 316, Männlich 176 , Unbekannt 0
RedeMalaiisch_MA_16MalayMalayms_MY16 kHzMedienaudio344Audiodaten von Malay MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 236, Männlich 626, Unbekannt 47
RedeMalayalam_CC_8MalayalamMalayalam (in Vorbereitung) ml_INCall Center60Malayalam (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMalayalam_GCMalayalamMalayalam (in Vorbereitung) ml_INAllgemeine Konversation100Malayalam (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMalayalam_MAMalayalamMalayalam (in Vorbereitung) ml_INMedienaudio40Malayalam (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMarathi_CC_8MarathiMarathi (in Vorbereitung) mr_INCall Center60Marathi (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMarathi_GCMarathiMarathi (in Vorbereitung) mr_INAllgemeine Konversation100Marathi (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMarathi_MAMarathiMarathi (in Vorbereitung) mr_INMedienaudio40Marathi (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeMexikaner_SM_48Spanisch (Mexiko)Spanisch (Mexiko)es-MX48 kHzGeskripteter Monolog1,492Mexikanisch-Spanisch geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1016 Männlich 1069 Unbekannt 95
RedeNiederlande_SM_48NiederländischNiederländischnl-NL48 kHzGeskripteter Monolog1,205Niederländischer geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1285 Männlich 531 Unbekannt 3
RedeNew York Englisch_CC_8New Yorker EnglischNew Yorker Englischen_US8 kHzCall Center103New York English Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 610, Männlich 532, Unbekannt 0
RedeNew York Englisch_GC_8New Yorker EnglischNew Yorker Englischen_US8 kHzAllgemeine Konversation107New York English General Conversation-DatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 118, Männlich 114, Unbekannt 0
RedeNew York Englisch_MA_16New Yorker EnglischNew Yorker Englischen_US16 kHzMedienaudio140Audiodaten von New York English MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 66, Männlich 230, Unbekannt 11
RedeNeuseeland_GC_8Neuseeland Englisch Neuseeland Englisch de_NZ8 kHzAllgemeine Konversation148Allgemeine Konversationsdaten für neuseeländisches EnglischUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 167, Männlich 121, Unbekannt 4
RedeNeuseeland_MA_16Neuseeland Englisch Neuseeland Englisch de_NZ16 kHzMedienaudio400Neuseeländisches englisches MedienaudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 367, Männlich 678, Unbekannt 26
RedeOriya_CC_8OriyaOriya (in Vorbereitung) oder_INCall Center60Oriya (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeOriya_GCOriyaOriya (in Vorbereitung) oder_INAllgemeine Konversation100Oriya (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeOriya_MAOriyaOriya (in Vorbereitung) oder_INMedienaudio40Oriya (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedePolnisch_MA_16PolnischPolnischpl_PL16 kHzMedienaudio269Polnische Medien AudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierungweiblich 173 männlich 354 unbekannt 6
RedePolnisch Poland_SM_48Polnisch (Polen)Polnisch (Polen)pl-PL48 kHzGeskripteter Monolog1,482Polnisches Polen - Geskripteter MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1324 Männlich 701 Unbekannt 24
RedePunjabi_CC_8PandschabiPunjabi (in Vorbereitung) PandschabiCall Center60Punjabi (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedePunjabi_GCPandschabiPunjabi (in Vorbereitung) PandschabiAllgemeine Konversation100Punjabi (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedePunjabi_MAPandschabiPunjabi (in Vorbereitung) Pandschabi Medienaudio40Punjabi (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeRussisch_SM_48RussischRussischru-RU48 kHzGeskripteter Monolog2,398Russischer geschriebener MonologAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1689 Männlich 1937 Unbekannt 214
RedeSchottisch_GC_8Schottisch (englischer Akzent)Schottisch (englischer Akzent)de_AB8 kHzAllgemeine Konversation292Schottische General Conversation-DatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungFrau 285, Mann 260, Unbekannt 3
RedeSingapur_CC_8Singapur englischSingapur englischde_SG8 kHzCall Center218Singapur Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 2139, Männlich 884, Unbekannt 21
RedeSingapur_MA_16Singapur englischSingapur englischde_SG16 kHzMedienaudio247Audiodaten von Singapore MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 160, Männlich 455, Unbekannt 37
RedeSüdafrikanisches Englisch_CC_8Südafrikanisches EnglischSüdafrikanisches Englischde_ZA8 kHzCall Center261Südafrikanisches Englisch Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1274 , Männlich 935 , Unbekannt 1
RedeSüdafrikanisches Englisch_MA_16Südafrikanisches EnglischSüdafrikanisches Englischde_ZA16 kHzMedienaudio251Audiodaten von südafrikanischen englischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 235, Männlich 432, Unbekannt 36
RedeSuaheli_CC_8SuaheliSuahelisw_KE8 kHzCall Center230Suaheli Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 611, Männlich 833, Unbekannt 0
RedeSuaheli_MA_16SuaheliSuahelisw_KE16 kHzMedienaudio265Audiodaten von Swahili MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 118, Männlich 493, Unbekannt 25
RedeSchwedisch_CC_8SchwedischSchwedischsv_SE8 kHzCall Center250Schwedische Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeibchen 1581, Männchen 727, Unbekannt 2
RedeSchwedisch_MA_16SchwedischSchwedischsv_SE16 kHzMedienaudio278Audiodaten der schwedischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeibchen 195, Männchen 500, Unbekannt 21
RedeTamilisch_CC_8TamilischTamilisch (in Vorbereitung) ta_INCall Center60Tamilische (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTamil_GCTamilischTamilisch (in Vorbereitung) ta_INAllgemeine Konversation100Allgemeine Konversationsdaten für Tamil (in Vorbereitung).Unbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTamil_MATamilisch Tamilisch (in Vorbereitung) ta_INMedienaudio40Tamilische (in Vorbereitung) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTelugu_GC_8TeluguTelugute_IN8 kHzAllgemeine Konversation553Telugu Allgemeine KonversationsdatenUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 574, Männlich 564, Unbekannt 0
RedeTelugu_MA_16TeluguTelugute_IN16 kHzMedienaudio648Audiodaten von Telugu MediaLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 207, Männlich 963, Unbekannt 2
RedeTelugu_CC_8TeluguTelugu (in Vorbereitung) te_INCall Center30Telugu (in Vorbereitung) Call-Center-DatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTelugu_GCTeluguTelugu (in Vorbereitung) te_INAllgemeine Konversation50Telugu (in Vorbereitung) Allgemeine GesprächsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,Desktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeTelugu_MATeluguTelugu (in Vorbereitung) te_INMedienaudio20Telugu (In Pipeline) Media-AudiodatenLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, Sprachmodellierung
RedeThai_GC_8ThaiThaith_TH8 kHzAllgemeine Konversation183Thai allgemeine KonversationUnbeschriebenes Telefongespräch zwischen zwei Personen. Ca. Audiodauer (Bereich) - 15-60 Minuten, Ein informelles Register, das zwischen Freunden verwendet wirdDualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 338, Männlich 96, Unbekannt 8
RedeThai_MA_8ThaiThaith_TH16 kHzMedienaudio173Thai Media-AudioLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 143, Männlich 502, Unbekannt 26
RedeTürkische Türkei_SM_48Türkische TürkeiTürkische Türkeitr-TR48 kHzGeskripteter Monolog2,027Türkische TürkeiAufzeichnungen mit einer einzelnen Äußerung, die in der Regel in den Bereich von 5 bis 30 Sekunden fallenMonoApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 1561 Männlich 1241 Unbekannt 31
RedeVietnamesisch_GC_8VietnamesischVietnamesischvi_VN8 kHzAllgemeine Konversation295Daten zur vietnamesischen allgemeinen KonversationUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten, Nord (z. B. Hanoi), Zentral und Süd (z. B. Ho-Chi-Minh-Stadt).DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 400, Männlich 380, Unbekannt 2
RedeVietnamesisch_MA_16VietnamesischVietnamesischvi_VN16 kHzMedienaudio257Audiodaten von vietnamesischen MedienLizenzierbare Public-Domain-Audio-/Videodateien wie Interviews, Podcasts usw. – 1 bis 5 Personen. Ca. Audiodauer (Bereich) 15-60 MinutenMonoWeb-Sourcing5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 249, Männlich 200, Unbekannt 45
RedeWelsh_GC_8Walisisch (englischer Akzent)Walisisch (englischer Akzent)de_WL8 kHzAllgemeine Konversation278Walisische allgemeine KonversationsdatenUnbeschriebenes, synthetisches Telefongespräch zwischen „Agent“ und „Kunde“, Ca. Audiodauer (Bereich) 5-15 Minuten,DualDesktop5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungWeiblich 270, Männlich 324, Unbekannt 0
RedeBritisches Englisch_WW_16UK EnglishUK Englishen_uk16 kHzWort wecken200Wake Word UK EnglischStichwort Sammlung von Daten
  • 200 Lautsprecher
  • 4 eindeutige Schlüsselphrasen pro Lautsprecher
  • 25-30 wiederholte Keyphrase-Aufnahmen pro einzigartigem Keyphrase
  • 25-30 Audiodateien pro eindeutiger Schlüsselphrase
  • Insgesamt 120 aufgezeichnete Äußerungen pro Sprecher
1 KanalApp5.0. Wav.jsonASR, virtueller Assistent, Chatbot, Konversations-KI, Sprachanalyse, TTS, SprachmodellierungGeschlecht: 50 % männlich, 50 % weiblich, +/- 10 %.

Dienstleistungen angeboten

Die fachmännische Audiodatenerfassung ist für umfassende KI-Setups nicht nur praktisch. Bei Shaip können Sie sogar die folgenden Dienste in Betracht ziehen, um Modelle weit verbreiteter als üblich zu machen:

Erfassung von Textdaten

Erfassung von Textdaten
DIENSTLEISTUNGEN

Der wahre Wert der kognitiven Datenerfassungsdienste von Shaip besteht darin, dass sie Unternehmen den Schlüssel zur Erschließung kritischer Informationen in unstrukturierten Daten liefern

Bilddatenerfassung

Bilddatenerfassungsdienste

Stellen Sie sicher, dass Ihr Computer-Vision-Modell jedes Bild genau identifiziert, um die KI-Modelle der nächsten Generation der Zukunft nahtlos zu trainieren

Videodatenerfassung

Dienste zur Erfassung von Videodaten

Konzentrieren Sie sich jetzt auf Computer Vision zusammen mit NLP, um Ihre Modelle zu trainieren, um Objekte, Personen, Abschreckungsmittel und andere visuelle Elemente perfekt zu identifizieren

Kontaktieren Sie uns

Möchten Sie Ihren eigenen Audiodatensatz erstellen?

Wenden Sie sich an unseren internen Experten für Sprachdatenerfassung, um ein Audio-Repository einzurichten, das Ihren Anforderungen am besten entspricht

  • Mit der Registrierung stimme ich Shaip zu Datenschutzrichtlinien und Nutzungsbedingungen und erteile meine Zustimmung zum Erhalt von B2B-Marketingkommunikation von Shaip.