Standardlizenzen für Gesichtsbilder und Videodaten

Standardmäßige Gesichtserkennungsdatensätze für das Training von KI-Modellen

Nutzung ethisch einwandfreier, demografisch vielfältiger Datensätze, um das Training von KI-Modellen zu beschleunigen und Voreingenommenheit für einen führenden globalen Technologiekonzern zu reduzieren.

Standardmäßige Datensätze zur Gesichtserkennung

Projektübersicht

Der Kunde wollte beschleunigen KI-gesteuerte Gesichtserkennungsentwicklung ohne lange, kostspielige Datenerfassungszyklen zu durchlaufen. Um dies zu erreichen, brauchten sie gebrauchsfertige Datensätze das waren nicht nur groß und vielfältig, aber auch ethisch einwandfrei bezogen und konform mit globalen Datenschutzbestimmungen.

Shaip lieferte umfassende Datensätze mit kontrollierten Variationen in Beleuchtung, Kopfhaltung, Okklusion und Emotionen. Dadurch konnten die Modelle des Kunden sowohl Genauigkeit als auch Fairness erreichen und gleichzeitig die erforderlichen ethnischen und demografischen Kriterien erfüllen. Jeder Datensatz enthielt detaillierte Metadaten, Posenanmerkungen und Begrenzungsrahmen für die Emotionserkennung. So konnten die Modelle in unterschiedlichsten, realen Szenarien trainiert und getestet werden.

Standardmäßige Datensätze zur Gesichtserkennung

Schlüsselstats

Über 7,000 Themen
im historischen Datensatz
mit über 300,000 Bildern
und 2,000 Videos.

Über 10,000 Themen
im Multi-Angle Emotion Dataset.

74,880-Bilder
in der Beleuchtung
Variationsdatensatz.

18,600-Bilder
für sechs
Kernemotionen.

Projektumfang

Der Kunde benötigt umfangreiche, ethisch einwandfreie und demografisch vielfältige Gesichtsbild- und Videodatensätze zur Unterstützung der Entwicklung und des Trainings von Gesichtserkennungsmodellen. Diese Datensätze waren für Anwendungsfälle in Anti-Spoofing-, Identitätsprüfungs-, Bildabgleichs- und Ausdrucksanalysesysteme, wodurch eine robuste und unvoreingenommene KI-Leistung in realen Anwendungen gewährleistet wird.

Der Umfang des Auftrags umfasste:

  • Delivering kuratierte Datensätze Entwickelt für Anwendungsfälle der Gesichtserkennung wie Anti-Spoofing, Identitätsprüfung und Ausdruckserkennung.
  • Providing Bilder und Videos mit ausführlichen Anmerkungen für Demografie, Kopfhaltung, Okklusion, Beleuchtungsart und Emotionen.
  • Gewährleisten ausgewogene demografische Abdeckung um systemische Voreingenommenheit in der Ausbildung zu reduzieren.
  • Gewährleistung Compliance und Zustimmung mit globalen Datenschutz- und Privatsphärestandards.

Beispiele für Datensatzbeiträge:

  • Historischer Datensatz (~7,000 Motive): Über 300,000 Bilder und 2,000 Videos mit Posen- und Okklusionsvariationen.
  • Multi-Angle-Emotionsdatensatz (~10,000 Personen): 15–20 Bilder pro Person aus verschiedenen Blickwinkeln und emotionalen Zuständen.
  • Datensatz „Sechs Emotionen“ (~3,100 Themen): 18,600 kommentierte Bilder, die grundlegende menschliche Ausdrücke abdecken.
  • Datensatz zur Beleuchtungsvariation (~468 Motive): 74,880 Bilder bei neun Lichtverhältnissen.

Probleme

Das Projekt befasste sich mit den wichtigsten Herausforderungen, die beim Aufbau robuster KI-Modelle üblich sind:

Verzerrung in KI-Modellen

Verhinderung einer Überrepräsentation bestimmter Ethnien oder Geschlechter, um Fairness zu gewährleisten.

Variabilität in der realen Welt

Erfassen von Lichtverhältnissen, Gesichtswinkeln, Okklusionen und natürlichen Ausdrücken.

Maßstab und Qualität

Bereitstellung von Hunderttausenden hochauflösender Bilder ohne Kompromisse bei der Vielfalt.

Einhaltung von Vorschriften

Einhaltung strenger globaler Datenschutzanforderungen mit vollständiger Zustimmung der Teilnehmer.

Die Lösung

Shaip implementierte eine strukturierter Ansatz um die Qualität und Relevanz des Datensatzes sicherzustellen:

  • Kuratierte, ausgewogene Datensätze mit breiter ethnischer, geschlechtlicher und altersbezogener Vertretung.
  • Gefangen Posen aus mehreren Winkeln und Beleuchtungsvariationen um reale Bedingungen nachzubilden.
  • Hinzugefügt ausführliche Anmerkungen (z. B. Kopfhaltung, Okklusion, Emotionen), um die Nutzbarkeit des Datensatzes zu verbessern.
  • Streng etabliert Qualitätskontroll- und Compliance-Workflows um eine ethische Beschaffung und die Einhaltung des Datenschutzes zu gewährleisten.

Datensatzportfolio

Datensatz Volume Demografie / Diversität Standards / Spezifikationen
Historischer Gesichtsbild- und Videodatensatz (~7,000 Personen) 7,000 Registrierungsbilder; über 300,000 historische Bilder; 2,000 Videos (1 Innen- + 1 Außenaufnahme pro 1,000 Personen) Ethnizität: Schwarz (35 %), Ostasiatisch (42 %), Südasiatisch (13 %), Weiß (10 %); Geschlecht: 50 % männlich / 50 % weiblich; Alter: Erwachsene ab 18 Jahren (letzte 10 Jahre) Videodauer: 1–2 Min.; Variation der Kopfhaltung (P1–P7); 5 Okklusionstypen (O0–O4)
Gesichtsbild-Datensatz (~5,000 Personen) 35 Bilder pro Motiv; 2,500 Inder; 1,000 Asiaten; 1,500 Schwarze Alter: 18–60 Jahre; Ausgewogene Geschlechterverteilung Keine Verschönerung; Abwechslungsreicher Hintergrund und Kleidung; Min. Auflösung: 960×1280
Multi-Angle-Emotionsdatensatz (~10,000 Probanden – Chinesisch) 15–20 Bilder pro Motiv; Posen: Vorne, Links, Rechts (30°–60°); Ausdrücke: Lächeln, offener Mund, traurig, ernst, neutral Ethnizität: Chinesisch; Alter: 18–26; Geschlecht: 50/50 aufgeteilt Auflösung: 2160×3840 Pixel oder höher
Datensatz zu sechs menschlichen Emotionen (~3,100 Personen) 6 Bilder pro Motiv (verschiedene Ausdrücke); 18,600 Bilder insgesamt Ethnien: Japaner (9,000), Koreaner (2,400), Chinesen (2,400), Südostasiaten (2,400), Südasiaten (2,400); Alter: 20–65 Jahre Begrenzungsrahmen-Anmerkungen für Emotionen; Einfache Hintergründe; Keine Hüte, Brillen oder Hindernisse
Datensatz zur Beleuchtungsvariation (~468 indische Probanden) 160 Bilder pro Motiv; Gesamt: 74,880 Bilder Alter: 20–70; 70 % männlich 9 Lichtverhältnisse (Innen, Außen, Seitenlicht, Gegenlicht, Neon usw.)
Multiethnischer Gesichtsbilddatensatz (~600 Personen) 3,752 Bilder insgesamt Ethnien: Afrikaner, Naher Osten, Ureinwohner Amerikas, Südasiaten, Südostasiaten; Alter: 20–70 Jahre -

Ergebnis

Die Zusammenarbeit hatte erhebliche geschäftliche und technische Auswirkungen:

  • Verbesserte Modellgenauigkeit: Verbesserte Präzision und Trefferquote für Gesichtserkennungsmodelle in mehreren Anwendungsfällen.
  • Reduzierung der Voreingenommenheit: Eine ausgewogene demografische Repräsentation reduzierte die systemische Verzerrung bei KI-Ergebnissen.
  • Beschleunigte Entwicklungszeitpläne: Standard-Datensätze ermöglichten schnelles Prototyping und Modelltraining ohne langwierige Datenerfassung.
  • Einhaltung von Vorschriften: Alle Datensätze entsprachen den globalen Datenschutzstandards und enthielten die Zustimmung der Teilnehmer.

Die vielfältigen, ethisch einwandfreien Datensätze von Shaip ermöglichten uns die benötigte Geschwindigkeit, Qualität und Compliance. Mit einsatzbereiten Daten beschleunigten wir das Training des KI-Modells und reduzierten systemische Verzerrungen deutlich.

Golden-5-Sterne