Offene Datensätze

Entdecken Sie Open-Source-Datasets, mit denen Sie ML-Modelle trainieren können

Datensätze öffnen

Open-Source-Datensätze für den Einstieg in KI/ML-Modelle

Die Ausgabe Ihrer KI- und ML-Modelle ist nur so gut wie die Daten, die Sie zum Trainieren verwenden – daher ist die Präzision, die Sie bei der Datenaggregation und beim Tagging und Identifizieren dieser Daten anwenden, wichtig!

Wenn Sie also eine neue KI/ML-Initiative starten möchten und jetzt schnell erkennen, dass das Auffinden hochwertiger Trainingsdaten einer der schwierigeren Aspekte Ihres Projekts sein wird, da hochwertige Datensätze der Treibstoff sind, der die KI/ ML-Motor läuft. Wir haben eine Liste mit offenen Datensätzen zusammengestellt, die Sie kostenlos verwenden und Ihre KI/ML-Modelle der Zukunft trainieren können.

Spezialisierung Dateityp Datensatzname Industrie / Abt. Anmerkung/Anwendungsfall Link
+NLP Text Amazon Bewertungen E-Commerce Stimmungsanalyse Link
+NLP Text Wikipedia-Link-Daten Allgemein Link
+NLP Text Standford Gefühlsbaumbank Unterhaltung Stimmungsanalyse Link
+NLP Text Twitter US-Airline-Sentiment Fluggesellschaft Stimmungsanalyse Link
+CV Bild Imagenet Allgemein Link
+CV Bild Googles offene Bilder Allgemein Link
+NLP Text Cornell-Filmdialoge Unterhaltung Dialoge Link
+NLP Text Yahoo Answers Allgemein Frage beantworten Link
+NLP Text MS MARCO Allgemein Frage beantworten Link
+NLP Text Datensatz „Natürliche Fragen“ Allgemein Frage beantworten Link
+NLP Text DBPedia Allgemein Wissen Graph Link
+NLP Text YAGO Allgemein Wissen Graph Link
+NLP Text FreeBase Allgemein Wissen Graph Link
+NLP Text Ontonotes Allgemein Semantische Rollenkennzeichnung Link
+NLP Text CoNLL 2003 Allgemein Anerkennung benannter Entitäten Link
+CV Bild KOKOSNUSS Allgemein Objekterkennung Link
+CV Bild PASCAL-VOC Allgemein Objekterkennung Link
+CV Bild Stadtlandschaften Autonomes Fahren Semantische Segmentierung Link
+CV Bild MNIST Allgemein Ziffernklassifizierung Link
+CV Bild Mode-MNIST Einzelhandel Bildklassifizierung Link
+NLP Audio LibriSpeech Allgemein ASR Link
+NLP Audio TED-LIUM Allgemein ASR Link
+NLP Audio TIMIT Allgemein Phonemerkennung Link
+NLP Audio Gemeinsame Stimme Allgemein ASR Link
+NLP Audio VoxCeleb Allgemein Sprechererkennung Link
+NLP Text Wikipedia-Dump Allgemein Sprachmodellierung Link
+NLP Text Gigaword Neuigkeiten Sprachmodellierung Link
+NLP Text IMDB Bewertungen Unterhaltung Stimmungsanalyse Link
+CV Video Kinetik-700 Allgemein Aktionserkennung Link
+CV Video UCF101 Allgemein Aktionserkennung Link
+CV Video HMDB51 Allgemein Aktionserkennung Link
+CV Bild LFW (Beschriftete Gesichter in der Wildnis) Allgemein Gesichtserkennung Link
+CV Bild CASIA-WebFace Allgemein Gesichtserkennung Link
+NLP Text Kader Allgemein Leseverständnis Link
+NLP Text NewsQA Neuigkeiten Leseverständnis Link
+NLP Text MultiNLI Allgemein Inferenz natürlicher Sprache Link
+NLP Text SNLI Allgemein Inferenz natürlicher Sprache Link
+NLP Text WikiText Allgemein Sprachmodellierung Link
+CV Bild Stanford Autos Automobilindustrie Feinkörnige Klassifizierung Link
+CV Bild Oxford Flowers 102 Pflanzenkunde Feinkörnige Klassifizierung Link
+CV Bild CIFAR-10 Allgemein Bildklassifizierung Link
+CV Bild CIFAR-100 Allgemein Bildklassifizierung Link
+CV Bild VOC-Personenlayout Allgemein Posenschätzung Link
+CV Bild MPII Menschliche Pose Allgemein Posenschätzung Link
+NLP Text Reuters-21578 Finanzen Textklassifizierung Link
+NLP Text 20 Newsgroups Allgemein Textklassifizierung Link