Fallstudie: Sammlung von Äußerungen

Über 7 Millionen Äußerungen bereitgestellt, um mehrsprachige digitale Assistenten in 13 Sprachen zu erstellen

Utterance collection

Real-World-Lösung

Daten, die globale Gespräche antreiben

Der Bedarf an Aussprachetraining entsteht, weil nicht alle Kunden die genauen Wörter oder Phrasen verwenden, während sie mit ihren Sprachassistenten in einem Skriptformat interagieren oder Fragen stellen. Deshalb müssen spezielle Sprachanwendungen auf spontane Sprachdaten trainiert werden. B. „Wo befindet sich das nächste Krankenhaus?“ „Finde ein Krankenhaus in meiner Nähe“ oder „Gibt es ein Krankenhaus in der Nähe?“ alle weisen auf die gleiche Suchabsicht hin, sind aber unterschiedlich formuliert.

Utterance collection1

Aufgabenstellung:

Um die Sprach-Roadmap des Digital Assistant des Kunden für weltweite Sprachen umzusetzen, musste das Team große Mengen an Trainingsdaten für das Spracherkennungs-KI-Modell erfassen. Die kritischen Anforderungen des Kunden waren:

  • Erfassen Sie große Mengen an Trainingsdaten (Eingabeaufforderungen für die Äußerung eines einzelnen Sprechers mit einer Länge von nicht mehr als 3 bis 30 Sekunden) für Spracherkennungsdienste in 13 globalen Sprachen
  • Für jede Sprache generiert der Anbieter Textaufforderungen, die die Sprecher aufzeichnen sollen (es sei denn, die
    Client-Lieferungen) und transkribieren Sie das resultierende Audio.
  • Stellen Sie Audiodaten und die Transkription aufgezeichneter Äußerungen mit entsprechenden JSON-Dateien bereit
    enthält die Metadaten für alle Aufzeichnungen.
  • Stellen Sie eine vielfältige Mischung von Sprechern nach Alter, Geschlecht, Bildung und Dialekt sicher
  • Stellen Sie eine vielfältige Mischung von Aufzeichnungsumgebungen gemäß den Spezifikationen sicher.
  • Jede Audioaufnahme muss mindestens 16 kHz, aber vorzugsweise 44 kHz haben

Beschleunigen Sie Ihre Gesprächs-KI
Anwendungsentwicklung zu 100 %

„Nachdem der Kunde viele Anbieter evaluiert hatte, entschied er sich für Shaip aufgrund ihrer Expertise in Konversations-KI-Projekten. Wir waren beeindruckt von der Projektdurchführungskompetenz von Shaip, ihrem Fachwissen, die erforderlichen Äußerungen von erfahrenen Linguisten in 13 Sprachen innerhalb strenger Fristen und mit der erforderlichen Qualität zu beschaffen, zu transkribieren und zu liefern.“

Lösung

Mit unserem tiefen Verständnis der Konversations-KI haben wir dem Kunden geholfen, die Daten mit einem Team von erfahrenen Linguisten und Kommentatoren zu sammeln, zu transkribieren und zu kommentieren, um seine KI-gestützte mehrsprachige Sprachverarbeitungs-Suite zu trainieren.

Der Arbeitsumfang für Shaip umfasste unter anderem den Erwerb großer Mengen von Audio-Trainingsdaten für die Spracherkennung, die Transkription von Audioaufnahmen in mehreren Sprachen für alle Sprachen unserer Tier-1- und Tier-2-Sprach-Roadmap und die Bereitstellung entsprechender Daten JSON Dateien, die die Metadaten enthalten. Shaip sammelte Äußerungen von 3 bis 30 Sekunden im Maßstab, während die gewünschte Qualität beibehalten wurde, die zum Trainieren von ML-Modellen für komplexe Projekte erforderlich ist.

  • Audio gesammelt, transkribiert und kommentiert: 22,250 Stunden
  • Unterstützte Sprachen: 13 (Dänisch, Koreanisch, Saudi-Arabisch, Niederländisch, Festland- und Taiwan-Chinesisch, Französisch-Kanadisch, Mexikanisches Spanisch, Türkisch, Hindi, Polnisch, Japanisch, Russisch)
  • Anzahl Äußerungen: Tausenden
  • Timeline: 7-8 Monate

Ai-powered speech processing multilingual voice suite

Beim Sammeln von Audioäußerungen bei 16 kHz stellten wir eine gesunde Mischung von Sprechern nach Alter, Geschlecht, Bildung und Dialekten in verschiedenen Aufnahmeumgebungen sicher.

Ergebnis

Die qualitativ hochwertigen Audiodaten von Sprachexperten ermöglichten es dem Kunden, sein mehrsprachiges Spracherkennungsmodell in 13 globalen Tier-1- und 2-Sprachen genau zu trainieren. Mit Goldstandard-Trainingsdatensätzen kann der Kunde intelligente und robuste digitale Unterstützung anbieten, um zukünftige reale Probleme zu lösen.

High-quality utterance audio data

Unsere Expertise

Redestunden gesammelt
0 +
Team von Sprachdatensammlern
0
PII-konform
0 %
Coole Nummer
0 +
Datenakzeptanz und Genauigkeit
> 0
Fortune-500-Klientel
0 +

Sagen Sie uns, wie wir Sie bei Ihrer nächsten KI-Initiative unterstützen können.