Synthetische Gesundheitsgespräche für ASR

Ermöglichung der Entwicklung von Ambient-Technologie durch synthetische Gespräche im Gesundheitswesen

Ambient-Technologie

Über 2000 Stunden Audiodaten wurden im klinischen Umfeld gesammelt und transkribiert

Im sich schnell entwickelnden Bereich der Konversations-KI liegt eine der bemerkenswertesten Anwendungen im Gesundheitssektor, wo Technologie zur Optimierung der Interaktionen zwischen Anbietern und Patienten eingesetzt wird. Unser Kunde, ein führender Name in der Gesundheitstechnologie, wandte sich an Shaip mit der Anforderung, sein ASR-Modell (Automatic Speech Recognition) zu verbessern, um Gespräche mit mehreren Sprechern in klinischen Umgebungen besser zu verstehen und zu transkribieren. Aufgrund von Datenschutzbestimmungen war es eine Herausforderung, reale Dialoge zu führen. Daher bestand die Idee darin, synthetische und dennoch realistische Interaktionen zwischen Gesundheitsdienstleistern und Patienten zu erstellen und zu transkribieren.

Volume

2,000 Stunden oder ungefähr 12,000 zu 24,000 einzelne synthetische Wechselwirkungen von 10 Durchschnittliche Dauer von Minuten.

Ziel

Unser Hauptziel bestand darin, rund 2,000 Stunden Audioaufnahmen zu erstellen, die sich in 12,000 bis 24,000 sorgfältig ausgearbeiteten synthetischen Interaktionen umsetzen und eine Vielfalt in Bezug auf Geschlecht, Alter, Akzente und medizinische Rollen verkörpern. Dieser umfassende und authentische Datensatz, der reale klinische Dialoge nachahmen soll, wurde unter strikter Einhaltung von Datenschutzbestimmungen wie HIPAA erstellt. Die synthetischen Interaktionen dienten als umfangreicher Datensatz, der maßgeblich zur Schulung und Verfeinerung des ASR-Modells unseres Kunden beitrug und dessen Kompetenz im Umgang mit realen Gesprächen in klinischen Umgebungen erheblich verbesserte.

 

Lernziele

Herausforderungen

Erfüllung gesetzlicher Auflagen

Die Einhaltung von Datenschutzgesetzen wie HIPAA sicherzustellen und gleichzeitig realistische und dennoch synthetische Interaktionen im Gesundheitswesen zu schaffen, kann eine Herausforderung sein.

Einhaltung gesetzlicher Vorschriften

Datenauthentizität und -vielfalt

Die Erstellung synthetischer Interaktionen, die reale klinische Dialoge genau nachahmen und gleichzeitig ein breites Spektrum an Szenarien, Akzenten, Altersgruppen und medizinischen Rollen abdecken, erfordert einen sorgfältigen Ansatz und fundierte Fachkenntnisse.

Datenauthentizität und -vielfalt

Qualitätssicherung

Um ein hohes Maß an Genauigkeit bei der Transkription zu erreichen, wie beispielsweise die angestrebte Word Accuracy Rate (WER) von 95 % und die Tag Accuracy Rate (TER) von 90 %, sind strenge Qualitätssicherungsprozesse erforderlich.

Technische Fähigkeiten

Es ist eine große Herausforderung sicherzustellen, dass die technische Infrastruktur, einschließlich der Aufnahme- und Transkriptionsplattformen, das Datenvolumen bewältigen und die Qualität aufrechterhalten kann.

Rekrutierung und Schulung von Ressourcen

Es kann eine ziemliche Herausforderung sein, Personen mit medizinischem Hintergrund für Rollenspiele zu rekrutieren und sicherzustellen, dass sie sich an realistische Szenarien halten und gleichzeitig einen natürlichen Gesprächsfluss aufrechterhalten. Darüber hinaus erfordert die Schulung von Transkriptionisten zur Einhaltung strenger Qualitätsrichtlinien erheblichen Aufwand und Fachwissen.

Ansatz/Lösung

Audiosammlung und Transkription

  • Szenarioerstellung: Entwickelte realistische Szenarien, die häufige, nicht dringende Erkrankungen widerspiegeln, die in der hausärztlichen Praxis für Erwachsene auftreten, wie Bluthochdruck, Diabetes und Schmerzbehandlung.
  • Rollenspiel: Rekrutierte Personen mit medizinischem Hintergrund, um als Gesundheitsdienstleister und Patienten Rollenspiele zu spielen, sich an die bereitgestellten Szenarien zu halten und reale klinische Gespräche zu simulieren.
  • Aufzeichnung: Verwendete die Shaip Work Mobile App für die Audioaufnahme und sorgte so für eine vielfältige Darstellung in Bezug auf Geschlecht, Alter, Akzente und beruflichen Hintergrund unter den Teilnehmern.

Validierung und Transkription

  • Ausführung von Validierungsskripten, um die Genauigkeit und Qualität der Audiodateien sicherzustellen.
  • Die Transkriptionen wurden auf der Bhasha-Plattform unter Einhaltung spezifischer Richtlinien durchgeführt und gewährleisteten eine wörtliche Texttranskription mit präziser Tagebuchführung.
  • Kommentierte Metadaten, einschließlich Sprecher-ID, Alter, Geschlecht, Muttersprache und medizinische Ausbildung/Erfahrung, die für die Modellschulungszwecke des Kunden von entscheidender Bedeutung waren.

Qualitätssicherung

  • Umfassende Qualitätsprüfungen durch CQA und PMO stellten ein Transkriptionsqualitätsziel von 95 % Word Accuracy Rate (WER) und 90 % Tag Accuracy Rate (TER) sicher.

Datenlieferung

  • Strukturierte die Daten klar und organisiert und lieferte sie stapelweise zusammen mit detaillierten Chargennotizen und Kulturverzeichnissen.
  • Es wurde sichergestellt, dass alle Daten, einschließlich Audiodateien, Transkriptionen und Metadaten, gemäß den Spezifikationen des Kunden genau beschriftet und formatiert wurden.

Feedback und Iteration

Etablierung einer robusten Feedbackschleife mit dem Kunden, um etwaige Mängel zu identifizieren und sicherzustellen, dass Korrekturen vorgenommen und ein vollständiger, genauer Datensatz geliefert wurde.

Wichtigsten Erfolge

  • Erfolgreiche Sammlung und Transkription von 2000 Stunden synthetischer Interaktionen im Gesundheitswesen.
  • Schnelle und genaue Transkription mit einer bemerkenswerten Genauigkeitsrate, die erheblich zum Ziel des Kunden beiträgt, sein ASR-Modell zu verbessern.
  • Demonstrierte Shaips Fähigkeit, große, komplexe Projekte mit einem akribischen Ansatz in Bezug auf Qualität und Genauigkeit abzuwickeln.

Ergebnis

Das sorgfältig durchgeführte, von Shaip unterstützte Projekt führte zu einem umfangreichen Datensatz, der wesentlich zur Verbesserung des ASR-Modells des Kunden beitrug. Die synthetischen Interaktionen erzeugten eine realistische Darstellung klinischer Dialoge und unterstützten den Kunden dabei, einen robusteren und zuverlässigeren Sprachdienst für das Gesundheitswesen zu erhalten. Durch einen strukturierten und gut koordinierten Ansatz stellte Shaip die erfolgreiche Umsetzung eines komplexen Projekts innerhalb des vorgegebenen Zeitrahmens sicher und festigte damit seine Expertise in der Verwaltung großer Konversations-KI-Projekte im Gesundheitswesen.

Unsere Zusammenarbeit mit Shaip hat unser Projekt im Bereich Ambient Technology und Conversational AI im Gesundheitswesen erheblich vorangebracht. Ihre Fachkenntnisse in der Erstellung und Transkription synthetischer Gesundheitsdialoge bildeten eine solide Grundlage und zeigten das Potenzial synthetischer Daten bei der Bewältigung regulatorischer Herausforderungen. Mit Shaip haben wir diese Hürden überwunden und sind nun der Verwirklichung unserer Vision intuitiver Gesundheitslösungen einen Schritt näher gekommen.

Golden-5-Sterne

Beschleunigen Sie Ihre KI im Gesundheitswesen
Anwendungsentwicklung zu 100 %