Standardlizenzen für Gesichtsbilder und Videodaten
Standardmäßige Gesichtserkennungsdatensätze für das Training von KI-Modellen
Nutzung ethisch einwandfreier, demografisch vielfältiger Datensätze, um das Training von KI-Modellen zu beschleunigen und Voreingenommenheit für einen führenden globalen Technologiekonzern zu reduzieren.
Projektübersicht
Der Kunde wollte beschleunigen KI-gesteuerte Gesichtserkennungsentwicklung ohne lange, kostspielige Datenerfassungszyklen zu durchlaufen. Um dies zu erreichen, brauchten sie gebrauchsfertige Datensätze das waren nicht nur groß und vielfältig, aber auch ethisch einwandfrei bezogen und konform mit globalen Datenschutzbestimmungen.
Shaip lieferte umfassende Datensätze mit kontrollierten Variationen in Beleuchtung, Kopfhaltung, Okklusion und Emotionen. Dadurch konnten die Modelle des Kunden sowohl Genauigkeit als auch Fairness erreichen und gleichzeitig die erforderlichen ethnischen und demografischen Kriterien erfüllen. Jeder Datensatz enthielt detaillierte Metadaten, Posenanmerkungen und Begrenzungsrahmen für die Emotionserkennung. So konnten die Modelle in unterschiedlichsten, realen Szenarien trainiert und getestet werden.
Schlüsselstats
Über 7,000 Themen
im historischen Datensatz
mit über 300,000 Bildern
und 2,000 Videos.
Über 10,000 Themen
im Multi-Angle Emotion Dataset.
74,880-Bilder
in der Beleuchtung
Variationsdatensatz.
18,600-Bilder
für sechs
Kernemotionen.
Projektumfang
Der Kunde benötigt umfangreiche, ethisch einwandfreie und demografisch vielfältige Gesichtsbild- und Videodatensätze zur Unterstützung der Entwicklung und des Trainings von Gesichtserkennungsmodellen. Diese Datensätze waren für Anwendungsfälle in Anti-Spoofing-, Identitätsprüfungs-, Bildabgleichs- und Ausdrucksanalysesysteme, wodurch eine robuste und unvoreingenommene KI-Leistung in realen Anwendungen gewährleistet wird.
Der Umfang des Auftrags umfasste:
- Delivering kuratierte Datensätze Entwickelt für Anwendungsfälle der Gesichtserkennung wie Anti-Spoofing, Identitätsprüfung und Ausdruckserkennung.
- Providing Bilder und Videos mit ausführlichen Anmerkungen für Demografie, Kopfhaltung, Okklusion, Beleuchtungsart und Emotionen.
- Gewährleisten ausgewogene demografische Abdeckung um systemische Voreingenommenheit in der Ausbildung zu reduzieren.
- Gewährleistung Compliance und Zustimmung mit globalen Datenschutz- und Privatsphärestandards.
Beispiele für Datensatzbeiträge:
- Historischer Datensatz (~7,000 Motive): Über 300,000 Bilder und 2,000 Videos mit Posen- und Okklusionsvariationen.
- Multi-Angle-Emotionsdatensatz (~10,000 Personen): 15–20 Bilder pro Person aus verschiedenen Blickwinkeln und emotionalen Zuständen.
- Datensatz „Sechs Emotionen“ (~3,100 Themen): 18,600 kommentierte Bilder, die grundlegende menschliche Ausdrücke abdecken.
- Datensatz zur Beleuchtungsvariation (~468 Motive): 74,880 Bilder bei neun Lichtverhältnissen.
Probleme
Das Projekt befasste sich mit den wichtigsten Herausforderungen, die beim Aufbau robuster KI-Modelle üblich sind:
Verhinderung einer Überrepräsentation bestimmter Ethnien oder Geschlechter, um Fairness zu gewährleisten.
Erfassen von Lichtverhältnissen, Gesichtswinkeln, Okklusionen und natürlichen Ausdrücken.
Bereitstellung von Hunderttausenden hochauflösender Bilder ohne Kompromisse bei der Vielfalt.
Einhaltung strenger globaler Datenschutzanforderungen mit vollständiger Zustimmung der Teilnehmer.
Die Lösung
Shaip implementierte eine strukturierter Ansatz um die Qualität und Relevanz des Datensatzes sicherzustellen:
- Kuratierte, ausgewogene Datensätze mit breiter ethnischer, geschlechtlicher und altersbezogener Vertretung.
- Gefangen Posen aus mehreren Winkeln und Beleuchtungsvariationen um reale Bedingungen nachzubilden.
- Hinzugefügt ausführliche Anmerkungen (z. B. Kopfhaltung, Okklusion, Emotionen), um die Nutzbarkeit des Datensatzes zu verbessern.
- Streng etabliert Qualitätskontroll- und Compliance-Workflows um eine ethische Beschaffung und die Einhaltung des Datenschutzes zu gewährleisten.
Datensatzportfolio
| Datensatz | Volume | Demografie / Diversität | Standards / Spezifikationen |
|---|---|---|---|
| Historischer Gesichtsbild- und Videodatensatz (~7,000 Personen) | 7,000 Registrierungsbilder; über 300,000 historische Bilder; 2,000 Videos (1 Innen- + 1 Außenaufnahme pro 1,000 Personen) | Ethnizität: Schwarz (35 %), Ostasiatisch (42 %), Südasiatisch (13 %), Weiß (10 %); Geschlecht: 50 % männlich / 50 % weiblich; Alter: Erwachsene ab 18 Jahren (letzte 10 Jahre) | Videodauer: 1–2 Min.; Variation der Kopfhaltung (P1–P7); 5 Okklusionstypen (O0–O4) |
| Gesichtsbild-Datensatz (~5,000 Personen) | 35 Bilder pro Motiv; 2,500 Inder; 1,000 Asiaten; 1,500 Schwarze | Alter: 18–60 Jahre; Ausgewogene Geschlechterverteilung | Keine Verschönerung; Abwechslungsreicher Hintergrund und Kleidung; Min. Auflösung: 960×1280 |
| Multi-Angle-Emotionsdatensatz (~10,000 Probanden – Chinesisch) | 15–20 Bilder pro Motiv; Posen: Vorne, Links, Rechts (30°–60°); Ausdrücke: Lächeln, offener Mund, traurig, ernst, neutral | Ethnizität: Chinesisch; Alter: 18–26; Geschlecht: 50/50 aufgeteilt | Auflösung: 2160×3840 Pixel oder höher |
| Datensatz zu sechs menschlichen Emotionen (~3,100 Personen) | 6 Bilder pro Motiv (verschiedene Ausdrücke); 18,600 Bilder insgesamt | Ethnien: Japaner (9,000), Koreaner (2,400), Chinesen (2,400), Südostasiaten (2,400), Südasiaten (2,400); Alter: 20–65 Jahre | Begrenzungsrahmen-Anmerkungen für Emotionen; Einfache Hintergründe; Keine Hüte, Brillen oder Hindernisse |
| Datensatz zur Beleuchtungsvariation (~468 indische Probanden) | 160 Bilder pro Motiv; Gesamt: 74,880 Bilder | Alter: 20–70; 70 % männlich | 9 Lichtverhältnisse (Innen, Außen, Seitenlicht, Gegenlicht, Neon usw.) |
| Multiethnischer Gesichtsbilddatensatz (~600 Personen) | 3,752 Bilder insgesamt | Ethnien: Afrikaner, Naher Osten, Ureinwohner Amerikas, Südasiaten, Südostasiaten; Alter: 20–70 Jahre | - |
Ergebnis
Die Zusammenarbeit hatte erhebliche geschäftliche und technische Auswirkungen:
- Verbesserte Modellgenauigkeit: Verbesserte Präzision und Trefferquote für Gesichtserkennungsmodelle in mehreren Anwendungsfällen.
- Reduzierung der Voreingenommenheit: Eine ausgewogene demografische Repräsentation reduzierte die systemische Verzerrung bei KI-Ergebnissen.
- Beschleunigte Entwicklungszeitpläne: Standard-Datensätze ermöglichten schnelles Prototyping und Modelltraining ohne langwierige Datenerfassung.
- Einhaltung von Vorschriften: Alle Datensätze entsprachen den globalen Datenschutzstandards und enthielten die Zustimmung der Teilnehmer.
Die vielfältigen, ethisch einwandfreien Datensätze von Shaip ermöglichten uns die benötigte Geschwindigkeit, Qualität und Compliance. Mit einsatzbereiten Daten beschleunigten wir das Training des KI-Modells und reduzierten systemische Verzerrungen deutlich.