Eine Fallstudie zum Gesichtserkennungsmodell
Anti-Spoofing-Videodatensatz für KI-Modelle zur Betrugserkennung
Entdecken Sie, wie Shaip 25,000 hochwertige Anti-Spoofing-Videodatensätze mit realen und wiederholten Angriffsszenarien bereitgestellt hat, um KI-Modelle für die Betrugserkennung zu trainieren.
Projektübersicht
Shaip hat sich mit einem führenden KI-Sicherheitsunternehmen zusammengetan, um einen hochwertigen, gebrauchsfertigen Anti-Spoofing-Videodatensatz bereitzustellen, der das Training von KI-Modellen zur Betrugserkennung verbessern soll. Der Datensatz umfasste 25,000 Videos, die sowohl reale als auch wiederholte Angriffsszenarien festhielten, und stellte so robuste Trainingsdaten für Anti-Spoofing-Modelle sicher.
Jeder der 12,500 Teilnehmer steuerte zwei Videos bei – ein echtes und ein Replay-Attack – aufgenommen bei 720p oder höhere Auflösung mit einer Bildrate von 26 FPS und mehr.
Ziel des Projekts war es, authentische und vielfältige Datensätze Dadurch könnten KI-Modelle effektiv zwischen echten und gefälschten biometrischen Videos unterscheiden und so das Betrugsrisiko bei biometrischen Authentifizierungssystemen verringern.
Schlüsselstats
25,000 Videos insgesamt (12,500 echte Videos, 12,500 Angriffsvideos erneut abspielen)
12,500 Unvergesslich
Teilnehmer
5 ethnische Gruppen
im Datensatz dargestellt
Phasenweise Lieferung: 4 Chargen von jeweils 6,250 Videos
Metadatenattribute: 12 Schlüsselparameter für eine verbesserte Nutzbarkeit des Datensatzes
Umfang biometrischer Datensätze zur Spoofing-Bekämpfung
Datensatzkuratierung: Das Projekt konzentrierte sich auf die Bereitstellung hochwertiger Anti-Spoofing-Videodatensätze bestehend aus echte und wiederholte AngriffsvideosZu den wichtigsten Aspekten gehörten:
- 12,500 Teilnehmer Beitrag jeweils zwei Videos (1 echt, 1 gefälscht).
- Vielfalt bei Aufnahmegeräten um die Modellanpassungsfähigkeit zu verbessern.
- Ausgewogene ethnische Vertretung um die Inklusivität des Datensatzes sicherzustellen.
Metadatensammlung: Jedes Video wurde begleitet von 12 Metadatenattribute um die Nutzbarkeit des Datensatzes zu verbessern.
Herausforderungen bei der Videodatenerfassung
Gleiche Vertretung
Aufrechterhaltung einer ausgewogenen Datenverteilung nach ethnischer Zugehörigkeit bei gleichzeitiger Beschaffung qualitativ hochwertiger Videos.
Qualitätskontrolle
Sicherstellen, dass jeder Teilnehmer ein echtes und ein wiederholtes Angriffsvideo beisteuert, um die Integrität des Datensatzes zu wahren.
Technische Konsistenz
Einhaltung strenger Richtlinien für FPS (≥ 26), Auflösung (≥ 720p) und Zeitstempelgenauigkeit (+/- 0.5 ms).
Wie wir es gelöst haben
Shaip lieferte einen strukturierten und hochwertigen Datensatz, der die Anforderungen des Projekts erfüllte. Die Lösung umfasste:
Datensatzkuratierung und Qualitätskontrolle
- 25,000 Videos gesammelt über 4-Phasen um einen stetigen und strukturierten Datenfluss zu gewährleisten und Engpässe zu vermeiden.
- Strenger Validierungsprozess um die Einhaltung sicherzustellen FPS, Auflösung und Metadatengenauigkeit. Jedes Video wurde vor der endgültigen Abnahme mehreren Qualitätskontrollen unterzogen.
- Umfassende Metadatenverschlagwortung und 12 Attribute:
- Datei-ID/Name
- Art des Angriffs (Real/Replay)
- Personen-ID
- Video-Auflösung
- Video Dauer
- Ethnizität des Subjekts
- Geschlecht des Subjekts
- Ob das Video original oder gefälscht ist
- Gerätename/Modell
- Person, die spricht oder nicht
- Zeitstempel Startzeit
- Zeitstempel-Endzeit
- Ausgewogene ethnische Gruppenverteilung: Der Datensatz wurde sorgfältig kuratiert, um eine ausgewogene ethnische Repräsentation zu gewährleisten. Die Verteilung umfasst Hispanics (33 %), Südasiaten (21 %), Kaukasier (20 %), Afrikaner (15 %) sowie Ostasiaten und den Nahen Osten (jeweils bis zu 6 %).
- Keine doppelten Einträge um die Einzigartigkeit des Datensatzes zu wahren und Verzerrungen beim KI-Training zu vermeiden.
- Ethnisch vielfältige Teilnehmerauswahl um einen Datensatz zu erstellen, der reale Benutzervariationen widerspiegelt und so die Anpassungsfähigkeit und Fairness des KI-Modells verbessert.
- Variation des Aufnahmegeräts Bezog mehrere Smartphone-Modelle, Kameras und Lichtverhältnisse mit ein, um die Robustheit des Modells gegenüber unterschiedlichen Umgebungsbedingungen zu verbessern.
Ergebnis
Der hochwertige, vielfältige Anti-Spoofing-Videodatensatz von Shaip ermöglichte es dem Kunden, KI-Modelle zu trainieren, um in verschiedenen biometrischen Authentifizierungsszenarien genau zwischen echten und gefälschten Videos zu unterscheiden. Der Datensatz trug dazu bei:
Entdeckung eines Betruges
Verbesserte KI-Leistung beim Erkennen betrügerischer biometrischer Angriffe.
Vielfältige Trainingsdaten
Die Fähigkeit des Modells, Replay-Angriffe über verschiedene Ethnien, Geräte und Umgebungsbedingungen hinweg zu erkennen, wurde gestärkt.
Skalierbarkeit
Der Datensatz dient als Grundlage für zukünftige Verbesserungen und Erweiterungen des Anti-Spoofing-Modells.
Der Datensatz von Shaip hat maßgeblich zur Verbesserung unserer KI-gesteuerten Anti-Spoofing-Modelle beigetragen. Die Vielfalt, Qualität und strukturierten Metadaten bildeten eine solide Grundlage für die Verbesserung der Betrugserkennung in biometrischen Authentifizierungssystemen.