Sprachbasierte UPI-Zahlungsaufforderungen: Erfassung der Vielfalt für verbesserte KI-Modelle

Nutzung der Fachkompetenz von Shaip bei der Erstellung von Eingabeaufforderungen und vielfältigen Audioaufnahmen, um sprachbasierte UPI-Zahlungssysteme mit qualitativ hochwertigen, kulturell vielfältigen Daten zu unterstützen.

Sprachbasierte UPI-Zahlungsaufforderungen

Projektübersicht

Shaip arbeitete mit einem führenden Fintech-Unternehmen zusammen, um eine sprachbasierte Zahlungsanwendung zu entwickeln, indem verschiedene UPI-Zahlungsaufforderungen erstellt und aufgezeichnet wurden. Das Projekt umfasste die Erstellung von 2,500 einzigartigen Aufforderungen und 87,000 diversifizierten Aufforderungen für 13 zahlungsbezogene Zwecke, wie z. B. Geld senden, Geld anfordern, Kontostand abfragen und Rechnungszahlungen. Diese Aufforderungen wurden über 200 Stunden von 45 Sprechern aus verschiedenen Regionen, mit unterschiedlichem Hintergrund und aus verschiedenen Altersgruppen aufgezeichnet, wodurch ein breites Spektrum an sprachlicher und umweltbezogener Vielfalt gewährleistet wurde.

Das Ziel des Projekts bestand darin, hochwertige Trainingsdaten für ein KI-Modell zu entwickeln, das Sprachbefehle im Zusammenhang mit UPI-Zahlungen in realen Umgebungen erkennen und darauf reagieren kann.

Sprachbasierte UPI-Zahlung

Schlüsselstats

Audiostunden der aufgezeichneten UPI-Zahlungsaufforderungen

200

Sprecher mit unterschiedlichem Hintergrund (Alter, Bildung, Region)

45

Abgedeckte Absichten mit über 87,000 unterschiedlichen Eingabeaufforderungen

13

Sprachen: Englisch, mit Sprechern verschiedener Muttersprachen (Kumaoni, Bengalisch, Malayalam, Gujarati, Hindi, Marathi usw.)

Projektumfang

Eingabeaufforderungserstellung

Der Umfang umfasste die Erstellung einzigartiger Eingabeaufforderungen für ein sprachbasiertes UPI-Zahlungssystem. Die Eingabeaufforderungen wurden so konzipiert, dass sie mehrere Absichten abdecken, und es wurde sichergestellt, dass sie in Struktur, Vokabular und benannten Entitäten unterschiedlich sind. Einige wichtige Aspekte waren:

13 Hauptabsichten, darunter:

  • Schick Geld: 65,653 einzigartige und abwechslungsreiche Eingabeaufforderungen
  • Guthabenabfrage: 3,052 Eingabeaufforderungen
  • Geld erbitten: 26,972 Eingabeaufforderungen
  • Transaktionsverlauf, Aufladen, Rechnungszahlung usw.

Audioaufnahme

Um Authentizität und praktische Anwendbarkeit zu gewährleisten, wurden die Eingabeaufforderungen von 45 Sprechern mit unterschiedlichem sprachlichen Hintergrund aufgezeichnet. Die Vielfalt, die durch verschiedene Muttersprachen, regionale Dialekte und Umgebungen (drinnen und draußen) erfasst wurde, trug zur Verbesserung der Trainingsdaten bei.

  • Sprachvielfalt: Benutzer sprechen fließend Englisch, haben aber verschiedene Muttersprachen wie Kumaoni, Gujarati, Hindi, Bangla, Marathi und Malayalam.
  • Alter, Geschlecht und Bildungshintergrund: Die Daten erfassten ein breites demografisches Spektrum.
  • Sprecher für Stadt und Land: Um die Verwendung in der realen Welt widerzuspiegeln, wurden sowohl städtische als auch ländliche Sprecher einbezogen.
  • Aufnahmeumgebung: Die Audioaufnahmen wurden sowohl im Innen- als auch im Außenbereich durchgeführt und mit verschiedenen Hintergrundgeräuschen ergänzt.

Probleme

Sprachliche und regionale Vielfalt

Um sicherzustellen, dass die Eingabeaufforderungen die unterschiedlichen regionalen Dialekte und Sprechereigenschaften widerspiegeln, waren sorgfältige Planung und Umsetzung erforderlich.

Natürliche Audiovariationen

Der Umgang mit Hintergrundgeräuschen und Umgebungsbedingungen (drinnen vs. draußen) war für die Anwendung in der realen Welt von entscheidender Bedeutung.

Vielfältige Sprecherprofile

Die Einbeziehung von Sprechern unterschiedlicher Altersgruppen und Bildungshintergründe sowie aus ländlichen und städtischen Regionen erschwerte die Erfassung authentischer Daten.

Die Lösung

Shaip lieferte eine Lösung, die die Herausforderungen des Projekts durch die Implementierung fortschrittlicher NLP-Techniken und sorgfältiger Planung sowohl bei der Erstellung als auch bei der Aufzeichnung von Eingabeaufforderungen bewältigte. Wichtige Aspekte des
Lösung inklusive:

Eingabeaufforderungserstellung

  • 2,500 Es wurden einzigartige Eingabeaufforderungen erstellt, die sich jeweils durch Struktur und Wortschatz unterschieden.
  • 13 Es wurden verschiedene Absichten abgedeckt, von einfachen Zahlungsaufforderungen bis hin zu komplexeren Anfragen, etwa zum Transaktionsverlauf oder zu Rechnungszahlungen.

Audioaufnahme

  • 200 Stunden der Audioaufnahmen wurden durchgeführt von 45 benutzer, um die Vielfalt hinsichtlich Muttersprachen, Umgebungen und Sprecherdemografie sicherzustellen.
  • Um eine natürliche Klangvariation zu gewährleisten, wurden für die Aufnahmen sowohl Innen- als auch Außenumgebungen genutzt.
  • Die Sprecher repräsentierten eine Reihe regionaler Dialekte, wodurch eine genaue sprachliche Darstellung gewährleistet wurde.
AbsichtAbsendenKontostandsabfrageGeld erbittenTransaktions History
PromptZahlen Sie zweitausendeinhundert für die Hausmiete nach Sumatri.Ich möchte meinen aktuellen Kontostand auf meinem Sparkonto wissen.Können Sie Raji, dreihundertachtzehn Rupien für einen Notfall anfordern?
Zeigen Sie mir den Transaktionsverlauf meiner Debitkarte.
Gujaratiસુમાત્રીને ઘરના ભાડા પેટે એકવીસસો ચૂકવોહું મારા બચત ખાતામાં મારી વર્તમાન બેલેન્સ. જાણ વા માંગુ છું.શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રણસો. અઢા Was ist los?મને મારા ડેબિટ કાર્ડના વ્યવહાર દેખાડો.
Hindiसुमात्री को मकान किराए के लिए इक्कीस सौ रुपए क ा भुगतान करें |मैं अपने बचत खाते में वर्तमान शेष राशि जानना च ाहता हूँ।क्या आप राजी से किसी इमरजेंसी के लिए तीन सौ. अठा Warum nicht?मुझे मेरा डेबिट कार्ड का लेनदेन ब्यौरा दिखाओ।
Malayalamവീട്ടുവാടകയായി സുമത്രിക്ക് രണ്ടായിരത്തിഒര ുന്നൂറ് നൽകൂ.എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലെ തുക അറി യാൻ ഞാൻ ആഗ്രഹിക്കുന്നു.രാജിയോട് മുന്നൂറ്റി പതിനെട്ട് രൂപ. അടിയന്തരാ Was ist los?എൻ്റെ ഡെബിറ്റ് കാർഡ് ഇടപാട് വിവരണം കാണിക്കൂ.
TeluguDas ist alles Jaనేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత. బ్యాల ెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను.ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దెనిమిద Was ist los?నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపి Ja.
Bangla-Spracheবাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ টাকা োধ করুনআমি আমার সঞ্চয় অ্যাকাউন্টে বর্তমান ব্যালেন ্স জানতে চাই।আপনি রাজির কাছে তাৎক্ষণিক অবস্থার জন্য তিনশো. Warum nicht?আমার ডেবিট কার্ডের লেনদেনের ইতিহাস দেখান।
Marathiसुमात्री ला घरा चे रेंट साठी दोन हजार एक संभर. र ुपये चुकवामला माये बचत खाते मधी चालू बॅलन्स जाणा च आहेकाय तुम्ही राजी पासून तीन सो अठराह रुपय मांगु शकते इमरजेंसी साठी ?मला माझे डेबिट कार्ड चे लेन देन दाखवा .

Das Ergebnis

Die hochwertigen, vielfältigen Audiodaten von Shaip ermöglichten es dem Kunden, ein KI-gesteuertes sprachbasiertes UPI-Zahlungssystem zu entwickeln, das Befehle in verschiedenen Dialekten, Umgebungen und Kontexten erkennen kann. Die Daten trugen zur Verbesserung bei:

  • Spracherkennung in Echtzeit in komplexen Umgebungen.
  • Genauere UPI-Transaktion Handhabung für einen breiteren Anwenderkreis.
  • Skalierbarkeit: Das Projekt legt einen soliden Grundstein für die Ausweitung auf andere indische Sprachen.

Leistungen

  • 200 Stunden von Audiodateien (8 kHz PCM WAV-Format, Mono)
  • 87,000+ abwechslungsreiche Eingabeaufforderungen mit einzigartigen Absichten
  • Metadaten: Sprecherprofile, Umgebungsdetails und Transkriptionsgenauigkeit

Shaips Fähigkeit, die Vielfalt Indiens durch einzigartige Aufforderungen und authentische Audioaufnahmen einzufangen, hat unser sprachbasiertes UPI-Zahlungssystem grundlegend verändert. Ihr Team stellte sicher, dass jeder Aspekt des Projekts – von der Erstellung der Aufforderung bis zur Aufnahmequalität – mit Präzision gehandhabt wurde, und half uns dabei, ein umfassenderes und robusteres Spracherkennungsmodell zu entwickeln.

Golden-5-Sterne