Fallstudie: Sammlung von Äußerungen

Über 7 Millionen Äußerungen bereitgestellt, um mehrsprachige digitale Assistenten in 13 Sprachen zu erstellen

Äußerungssammlung

Real-World-Lösung

Daten, die globale Gespräche antreiben

Der Bedarf an Aussprachetraining entsteht, weil nicht alle Kunden die genauen Wörter oder Phrasen verwenden, während sie mit ihren Sprachassistenten in einem Skriptformat interagieren oder Fragen stellen. Deshalb müssen spezielle Sprachanwendungen auf spontane Sprachdaten trainiert werden. B. „Wo befindet sich das nächste Krankenhaus?“ „Finde ein Krankenhaus in meiner Nähe“ oder „Gibt es ein Krankenhaus in der Nähe?“ alle weisen auf die gleiche Suchabsicht hin, sind aber unterschiedlich formuliert.

Sammlung von Äußerungen1

Aufgabenstellung:

Um die Sprach-Roadmap des Digital Assistant des Kunden für weltweite Sprachen umzusetzen, musste das Team große Mengen an Trainingsdaten für das Spracherkennungs-KI-Modell erfassen. Die kritischen Anforderungen des Kunden waren:

  • Erfassen Sie große Mengen an Trainingsdaten (Eingabeaufforderungen für die Äußerung eines einzelnen Sprechers mit einer Länge von nicht mehr als 3 bis 30 Sekunden) für Spracherkennungsdienste in 13 globalen Sprachen
  • Für jede Sprache generiert der Anbieter Textaufforderungen, die die Sprecher aufzeichnen sollen (es sei denn, die
    Client-Lieferungen) und transkribieren Sie das resultierende Audio.
  • Stellen Sie Audiodaten und die Transkription aufgezeichneter Äußerungen mit entsprechenden JSON-Dateien bereit
    enthält die Metadaten für alle Aufzeichnungen.
  • Stellen Sie eine vielfältige Mischung von Sprechern nach Alter, Geschlecht, Bildung und Dialekt sicher
  • Stellen Sie eine vielfältige Mischung von Aufzeichnungsumgebungen gemäß den Spezifikationen sicher.
  • Jede Audioaufnahme muss mindestens 16 kHz, aber vorzugsweise 44 kHz haben

Beschleunigen Sie Ihre Gesprächs-KI
Anwendungsentwicklung zu 100 %

„Nachdem der Kunde viele Anbieter evaluiert hatte, entschied er sich für Shaip aufgrund ihrer Expertise in Konversations-KI-Projekten. Wir waren beeindruckt von der Projektdurchführungskompetenz von Shaip, ihrem Fachwissen, die erforderlichen Äußerungen von erfahrenen Linguisten in 13 Sprachen innerhalb strenger Fristen und mit der erforderlichen Qualität zu beschaffen, zu transkribieren und zu liefern.“

Lösung

Mit unserem tiefen Verständnis der Konversations-KI haben wir dem Kunden geholfen, die Daten mit einem Team von erfahrenen Linguisten und Kommentatoren zu sammeln, zu transkribieren und zu kommentieren, um seine KI-gestützte mehrsprachige Sprachverarbeitungs-Suite zu trainieren.

Der Arbeitsumfang für Shaip umfasste unter anderem den Erwerb großer Mengen von Audio-Trainingsdaten für die Spracherkennung, die Transkription von Audioaufnahmen in mehreren Sprachen für alle Sprachen unserer Tier-1- und Tier-2-Sprach-Roadmap und die Bereitstellung entsprechender Daten JSON Dateien, die die Metadaten enthalten. Shaip sammelte Äußerungen von 3 bis 30 Sekunden im Maßstab, während die gewünschte Qualität beibehalten wurde, die zum Trainieren von ML-Modellen für komplexe Projekte erforderlich ist.

  • Audio gesammelt, transkribiert und kommentiert: 22,250 Stunden
  • Unterstützte Sprachen: 13 (Dänisch, Koreanisch, Saudi-Arabisch, Niederländisch, Festland- und Taiwan-Chinesisch, Französisch-Kanadisch, Mexikanisches Spanisch, Türkisch, Hindi, Polnisch, Japanisch, Russisch)
  • Anzahl Äußerungen: 7M +
  • Timeline: 7-8 Monate

Beim Sammeln von Audioäußerungen bei 16 kHz stellten wir eine gesunde Mischung von Sprechern nach Alter, Geschlecht, Bildung und Dialekten in verschiedenen Aufnahmeumgebungen sicher.

Ergebnis

Die hochwertigen Audiodaten der Äußerungen von erfahrenen Linguisten ermöglichten es dem Kunden, genau zu trainieren
ihr mehrsprachiges Spracherkennungsmodell in 13 globalen Tier-1- und Tier-2-Sprachen. Mit Goldstandard-Trainingsdatensätzen kann der Kunde intelligente und robuste digitale Unterstützung anbieten, um zukünftige reale Probleme zu lösen.

Unsere Expertise

0 +
Redestunden gesammelt
0
Team von Sprachdatensammlern
0 %
PII-konform
0 +
Coole Nummer
> 0
Datenakzeptanz und Genauigkeit
0 +
Fortune-500-Klientel

Sagen Sie uns, wie wir Sie bei Ihrer nächsten KI-Initiative unterstützen können.