Electronic Health Records (EHR)-Datensätze für KI- und ML-Projekte
Serienmäßige Electronic Health Records (EHR)-Datensätze, um Ihr KI-Projekt im Gesundheitswesen in Gang zu bringen.
Fügen Sie die medizinischen Daten ein, die Sie heute vermisst haben
Finden Sie die richtigen Daten für elektronische Patientenakten (EHR) für Ihre KI im Gesundheitswesen
Verbessern Sie Ihre Modelle für maschinelles Lernen mit erstklassigen Trainingsdaten. Elektronische Gesundheitsakten oder EHR sind Krankenakten, die die Krankengeschichte, Diagnosen, Rezepte, Behandlungspläne, Impf- oder Immunisierungsdaten, Allergien, radiologische Bilder (CT-Scan, MRT, Röntgen) sowie Labortests und mehr enthalten. Unser Standard-Datenkatalog macht es Ihnen leicht, medizinische Trainingsdaten zu erhalten, denen Sie vertrauen können.
Elektronische Patientenakten (EHR) von der Stange:
- 5.1 Millionen Aufzeichnungen und Audiodateien von Ärzten in 31 Fachgebieten
- Echte medizinische Aufzeichnungen nach Goldstandard zum Trainieren von klinischem NLP und anderen Dokumenten-KI-Modellen
- Metadateninformationen wie MRN (anonymisiert), Aufnahmedatum, Entlassungsdatum, Aufenthaltsdauer in Tagen, Geschlecht, Patientenklasse, Kostenträger, Finanzklasse, Bundesland, Entlassungsdisposition, Alter, DRG, DRG-Beschreibung, $ Erstattung, AMLOS, GMLOS, Risiko von Sterblichkeit, Schweregrad der Erkrankung, Zackenbarsch, Postleitzahl des Krankenhauses usw.
- Krankenakten aus verschiedenen US-Bundesstaaten und Regionen – Nordosten (46 %), Süden (9 %), Mittlerer Westen (3 %), Westen (28 %), Andere (14 %)
- Krankenakten, die zu allen abgedeckten Patientenklassen gehören – stationär, ambulant (klinisch, Reha, wiederkehrende, chirurgische Tagespflege), Notfall.
- Krankenakten aller Altersgruppen der Patienten < 10 Jahre (7.9 %), 11–20 Jahre (5.7 %), 21–30 Jahre (10.9 %), 31–40 Jahre (11.7 %), 41–50 Jahre (10.4 % ), 51–60 Jahre (13.8 %), 61–70 Jahre (16.1 %), 71–80 Jahre (13.3 %), 81–90 Jahre (7.8 %), 90+ Jahre (2.4 %)
- Geschlechterverhältnis der Patienten von 46 % (männlich) und 54 % (weiblich)
- PII redigierte Dokumente, die den Safe-Harbor-Richtlinien in Übereinstimmung mit HIPAA entsprechen
EHR-Daten nach Standort
Standort | Textdokumente |
---|---|
Nordost | 4,473,573 |
Süd | 1,801,716 |
Mittlerer Westen | 781,701 |
West | 1,509,109 |
EHR-Daten nach Hauptdiagnosekategorie
EHR-Daten nach Hauptdiagnosekategorie | Textdokumente |
---|---|
Blutkreislauf | 589,730 |
Infektiöse und parasitäre Krankheiten | 559,244 |
Atmungssystem | 561,983 |
Bewegungsapparat & Bindegewebe | 329,344 |
Verdauungssystem | 346,369 |
Nervensystem | 316,243 |
Psychische Erkrankungen und Störungen | 282,501 |
Niere & Harnwege | 209,561 |
Schwangerschaft, Geburt & Wochenbett | 165,303 |
Neugeborene und andere Neugeborene mit Erkrankungen, die aus der Perinatalperiode stammen | 163,605 |
Endokrine, Ernährungs- und Stoffwechselkrankheiten und -störungen | 142,808 |
Hepatobiliäres System & Pankreas | 127,172 |
Haut, Unterhautgewebe & Brust | 89,577 |
Verletzungen, Vergiftungen und toxische Wirkungen von Medikamenten | 64,097 |
Blut, blutbildende Organe, immunologische Erkrankungen | 48,990 |
Alkohol-/Drogenkonsum und alkohol-/drogeninduzierte organische psychische Störungen | 48,717 |
Multiple signifikante Traumata | 27,902 |
Ohr, Nase, Mund & Rachen | 22,987 |
Weiblicher Fortpflanzungsapparat | 17,010 |
Faktoren, die den Gesundheitszustand und andere Kontakte mit Gesundheitsdiensten beeinflussen | 21,294 |
Myeloproliferative Erkrankungen und Störungen, schlecht differenzierte Neoplasmen | 15,620 |
Infektionen mit dem humanen Immunschwächevirus | 12,422 |
Männliche Fortpflanzungssystem | 9,230 |
Auge | 3,549 |
Verbrennungen | 444 |
Alkohol-/Drogenkonsum oder induzierte psychische Störungen | 48,717 |
Gesamt mit MDC | 4,175,702 |
Fälle mit einem Spezial-Grouper wie 3M (MDC nicht angegeben) | 1,619,682 |
Ambulante Fälle (MDC nicht angegeben) | 1,980,606 |
Fälle ohne Erstattung generiert (MDC nicht angegeben) | 790,697 |
Gesamt inklusive allem (Fälle mit & ohne MDC-Kategorie) | 8,566,687 |
Wir befassen uns mit allen Arten von Datenlizenzen, dh Text, Audio, Video oder Bild. Die Datensätze bestehen aus medizinischen Datensätzen für ML: Arztdiktatdatensatz, klinische Notizen des Arztes, medizinischer Gesprächsdatensatz, medizinischer Transkriptionsdatensatz, Arzt-Patienten-Gespräch, medizinische Textdaten, medizinische Bilder – CT-Scan, MRT, Ultraschall (gesammelte Basis benutzerdefinierter Anforderungen) .
Können Sie nicht finden, wonach Sie suchen?
Über alle Datentypen hinweg werden neue medizinische Standarddatensätze gesammelt
Kontaktieren Sie uns jetzt, um Ihre Sorgen um die Erfassung von Gesundheitstrainingsdaten loszuwerden