Fallstudie: Sammlung von Äußerungen
Über 7 Millionen Äußerungen bereitgestellt, um mehrsprachige digitale Assistenten in 13 Sprachen zu erstellen
Real-World-Lösung
Daten, die globale Gespräche antreiben
Der Bedarf an Aussprachetraining entsteht, weil nicht alle Kunden die genauen Wörter oder Phrasen verwenden, während sie mit ihren Sprachassistenten in einem Skriptformat interagieren oder Fragen stellen. Deshalb müssen spezielle Sprachanwendungen auf spontane Sprachdaten trainiert werden. B. „Wo befindet sich das nächste Krankenhaus?“ „Finde ein Krankenhaus in meiner Nähe“ oder „Gibt es ein Krankenhaus in der Nähe?“ alle weisen auf die gleiche Suchabsicht hin, sind aber unterschiedlich formuliert.

Aufgabenstellung:
Um die Sprach-Roadmap des Digital Assistant des Kunden für weltweite Sprachen umzusetzen, musste das Team große Mengen an Trainingsdaten für das Spracherkennungs-KI-Modell erfassen. Die kritischen Anforderungen des Kunden waren:
- Erfassen Sie große Mengen an Trainingsdaten (Eingabeaufforderungen für die Äußerung eines einzelnen Sprechers mit einer Länge von nicht mehr als 3 bis 30 Sekunden) für Spracherkennungsdienste in 13 globalen Sprachen
- Für jede Sprache generiert der Anbieter Textaufforderungen, die die Sprecher aufzeichnen sollen (es sei denn, die
Client-Lieferungen) und transkribieren Sie das resultierende Audio. - Stellen Sie Audiodaten und die Transkription aufgezeichneter Äußerungen mit entsprechenden JSON-Dateien bereit
enthält die Metadaten für alle Aufzeichnungen. - Stellen Sie eine vielfältige Mischung von Sprechern nach Alter, Geschlecht, Bildung und Dialekt sicher
- Stellen Sie eine vielfältige Mischung von Aufzeichnungsumgebungen gemäß den Spezifikationen sicher.
- Jede Audioaufnahme muss mindestens 16 kHz, aber vorzugsweise 44 kHz haben
„Nachdem der Kunde viele Anbieter evaluiert hatte, entschied er sich für Shaip aufgrund ihrer Expertise in Konversations-KI-Projekten. Wir waren beeindruckt von der Projektdurchführungskompetenz von Shaip, ihrem Fachwissen, die erforderlichen Äußerungen von erfahrenen Linguisten in 13 Sprachen innerhalb strenger Fristen und mit der erforderlichen Qualität zu beschaffen, zu transkribieren und zu liefern.“
Die Lösung
Mit unserem tiefen Verständnis der Konversations-KI haben wir dem Kunden geholfen, die Daten mit einem Team von erfahrenen Linguisten und Kommentatoren zu sammeln, zu transkribieren und zu kommentieren, um seine KI-gestützte mehrsprachige Sprachverarbeitungs-Suite zu trainieren.
Der Arbeitsumfang für Shaip umfasste unter anderem den Erwerb großer Mengen von Audio-Trainingsdaten für die Spracherkennung, die Transkription von Audioaufnahmen in mehreren Sprachen für alle Sprachen unserer Tier-1- und Tier-2-Sprach-Roadmap und die Bereitstellung entsprechender Daten JSON Dateien, die die Metadaten enthalten. Shaip sammelte Äußerungen von 3 bis 30 Sekunden im Maßstab, während die gewünschte Qualität beibehalten wurde, die zum Trainieren von ML-Modellen für komplexe Projekte erforderlich ist.
- Audio gesammelt, transkribiert und kommentiert: 22,250 Stunden
- Unterstützte Sprachen: 13 (Dänisch, Koreanisch, Saudi-Arabisch, Niederländisch, Festland- und Taiwan-Chinesisch, Französisch-Kanadisch, Mexikanisches Spanisch, Türkisch, Hindi, Polnisch, Japanisch, Russisch)
- Anzahl Äußerungen: Tausenden
- Timeline: 7-8 Monate
Beim Sammeln von Audioäußerungen bei 16 kHz stellten wir eine gesunde Mischung von Sprechern nach Alter, Geschlecht, Bildung und Dialekten in verschiedenen Aufnahmeumgebungen sicher.
Ergebnis
Die qualitativ hochwertigen Audiodaten von Sprachexperten ermöglichten es dem Kunden, sein mehrsprachiges Spracherkennungsmodell in 13 globalen Tier-1- und 2-Sprachen genau zu trainieren. Mit Goldstandard-Trainingsdatensätzen kann der Kunde intelligente und robuste digitale Unterstützung anbieten, um zukünftige reale Probleme zu lösen.
Unsere Expertise
Empfohlene Ressourcen
Käufer-Führer
Einkaufsführer: Conversational AI
Der Chatbot, mit dem Sie sich unterhalten haben, läuft auf einem fortschrittlichen Konversations-KI-System, das mit unzähligen Spracherkennungsdatensätzen trainiert, getestet und erstellt wurde.
Blog
Der Stand der Conversational AI 2021
Die Infografiken zu Conversational AI 2021 sprechen darüber, was Conversational AI ist, ihre Entwicklung, Typen, den Conversational AI-Markt nach Regionen, Anwendungsfälle, Herausforderungen usw.
Blog
3 Hindernisse für die Entwicklung der Konversations-KI
Shaip kurbelt die Entwicklung der Konversations-KI als Tool zur Kundenbindung an, indem es die erforderlichen annotierten Audiodaten in über 50 Sprachen anbietet.
Sagen Sie uns, wie wir Sie bei Ihrer nächsten KI-Initiative unterstützen können.