Medizinische Informatik: Statistik

Zurück zur Übersicht

Einleitung

Bearbeiten

In einigen Punkten hat die Einführung des Computers statistische Berechnungen in der Medizin entscheidend verbessert:

  • Ohne Computer war die Datenerfassung in einem Karteikasten oder etwas ähnlichem sehr mühsam
  • Ohne Computer musste man tagelang rechnen, bis man eine statistische Auswertung fertig bekam.
  • Das Verfassen einer medizinischen Arbeit mit der Schreibmaschine war mühsam. Viele Seiten mussten wegen kleiner Fehler noch einmal geschrieben werden.
  • Die Suche nach speziellen Patientendaten geht heute viel schneller, da vieles in den Krankenhäusern oder Arztpraxen bereits edv-mäßig erfasst ist.

Man hat also eigentlich genügend Zeit für wichtige Fragen, bei denen der Computer wenig helfen wird:

  • Was will ich eigentlich untersuchen ?
  • Wie komme ich am besten an meine Daten ?
  • Wie erfasse ich meine Daten gleich so, daß ich sie hinterher auch gut auswerten kann ?
  • Wie werte ich meine Daten aus ?
  • Kritische Bewertung von Studien und deren Statistiken

Will man ein paar gute medizinische Arbeiten lesen, in denen die medizinische Statistik in der Regel hervorragend umgesetzt wurde, dann sollte man sich Orginalarbeiten aus dem   Lancet oder dem   New England Journal of Medicine anschauen. Empfehlenswert sind auch die Zusammenfassungen auf folgender Website:

Der 4 Felder Test, ein simples aber wichtiges Instrument für die medizinische Statistik

Bearbeiten

Der 4-Feldertest ist ein universelles Statistikwerkzeug für Mediziner. Man sollte ein bißchen mit ihm herumspielen, dann weiß man wie er funktioniert und wie man Daten damit bewerten kann.

Der Vierfeldertest dient dazu, die Häufigkeit eines Merkmals in zwei unabhängigen Gruppen zu vergleichen

Visual Basic 3.0 Quelltext

Bearbeiten
Sub Befehl1_Click () 
Rem Fehlerroutine bei leeren Feldern einbauen 
text5.Text = "" 
N1 = Val(text1.Text) 
N2 = Val(text2.Text) 
M1 = Val(text3.Text) 
M2 = Val(text4.Text) 
Rem ERWARTUNGSWERT EN1 
R1 = N1 + M1 
NN = N1 + N2 
N = N1 + N2 + M1 + M2 
E1 = R1 * NN / N 
text5.Text = text5.Text + "Erwartungswert E1 =" + Str(E1) + Chr(13) + Chr(10) 
Rem ERWARTUNGSWERT EN2 
MM = M1 + M2 
E2 = R1 * MM / N 
text5.Text = text5.Text + "Erwartungswert E2 =" + Str(E2) + Chr(13) + Chr(10)  
Rem ERWARTUNGSWERT EN3 
R2 = N2 + M2 
E3 = R2 * NN / N 
text5.Text = text5.Text + "Erwartungswert E3 =" + Str(E3) + Chr(13) + Chr(10) 
Rem ERWARTUNGSWERT EN4 
E4 = R2 * MM / N 
text5.Text = text5.Text + "Erwartungswert E4 =" + Str(E4) + Chr(13) + Chr(10) 
Rem PROBE=0? 
S = E1 + E2 + E3 + E4 
P = S - N 
text5.Text = text5.Text + "Probe" + Str(S) + "-" + Str(N) + "=" + Str(P) + "=0?" + Chr(13) + Chr(10) 
Rem CHI^2 
D1 = (N1 - E1) ^ 2: C1 = D1 / E1 
D2 = (M1 - E2) ^ 2: C2 = D2 / E2 
D3 = (N2 - E3) ^ 2: C3 = D3 / E3 
D4 = (M2 - E4) ^ 2: C4 = D4 / E4 
C = C1 + C2 + C3 + C4 
text5.Text = text5.Text + "CHI-QUADRAT=" + Str(C) + Chr(13) + Chr(10) 
If C - 3.841 > 0 Then text5.Text = text5.Text + "Bei P=0.05 besteht ein signifikanter Unterschied" 
If C - 3.841 <= 0 Then text5.Text = text5.Text + "Bei P=0.05 besteht kein signifikanter Unterschied " 
End Sub 


Beispiel:

Bearbeiten

Man befragt 50 Frauen ( GRUPPE 1) , ob sie rauchen oder nicht.

Dasselbe macht man mit 50 Männern ( GRUPPE 2).

Man erhält das Ergebnis :

FRAUEN : 25 Raucher 25 Nichtraucher 
MÄNNER : 30 Raucher 20 Nichtraucher 

Kann man anhand dieser Befragung schon sagen , ob es mehr Nichtraucher unter den Frauen gibt ?

Diese Frage beantwortet der Vierfelder Test .

Dazu muß man die Werte beider Gruppen eingeben und eine Irrtumswahrscheinlichkeit wählen. ( Hier p = 0.05 )

Wollen Sie das Ergebnis mal testen ?

Erwartungswert E1 = 27.5 
Erwartungswert E2 = 27.5 
Erwartungswert E3 = 22.5 
Erwartungswert E4 = 22.5 
Probe 100- 100= 0=0? 
CHI-QUADRAT= 1.01010101010101 
Bei P=0.05 besteht kein signifikanter Unterschied 

2 Schlüsse kann man aus diesem Ergebnis ziehen :

==> Entweder es gibt tatsächlich keinen Unterschied in der Verteilung des Merkmals Raucher/Nichtraucher ODER

==> die Stichproben aus beiden Gruppen waren zu klein

Probieren Sie mal , dieselben Werte nur alle mal 10 genommen.

Frauen: 250 Nichtraucher 250 Raucher 
Männer: 300 Nichtraucher 200 Raucher 

Wollen Sie noch einmal testen , dann drücken Sie auf die Taste SIGNIFIKANZBERECHNUNG !

Erwartungswert E1 = 275 
Erwartungswert E2 = 275 
Erwartungswert E3 = 225 
Erwartungswert E4 = 225 
Probe 1000- 1000= 0=0? 
CHI-QUADRAT= 10.1010101010101 

Bei P=0.05 besteht ein signifikanter Unterschied

Dann sieht das Ergebnis anders aus. Wenn man kleine Unterschiede finden will,braucht man also große Zahlen in den Stichproben.

Tipps für die medizinische Doktorarbeit

Bearbeiten

Man will im Rahmen einer Doktorarbeit medizinische Daten erheben und möchte diese zur Beantwortung einer Fragestellung auswerten.

Dabei empfiehlt sich:

  • Erfassung der Daten in einer bestimmten Struktur z.B. in EXCEL oder Formular in ACCESS
  • Patientennamen und Daten in 2 getrennten Dateien erfassen, wenn man die Daten extern auswerten lassen will.
    • Jedem Patienten wird eine Nummer zu geordnet ( Tabelle Name - FallNummer )
    • Eigentliche Datentabelle mit FallNummer - Daten

Datentabelle

Bearbeiten
  • Kategorien werden mit Zahlen verschlüsselt (z.B. 1 bedeutet männlich, 2 bedeutet weiblich)
  • Zeilen in der Tabelle sind Fälle (Patienten, Probanden, Tiere), in der Regel eine Zeile pro Fall
  • Spalten in der Tabelle sind die Variablen (Alter, Geschlecht, Laborwerte ...)
  • jede Variable wird durch einen plausiblen Namen definiert mit dem in der Statistiksoftware gearbeitet wird.
    • dieser Name muss
      • eindeutig sein,
      • sollte eine Länge von maximal 8 Zeichen haben,
      • mit einem Buchstaben beginnen und
      • keine Sonderzeichen und Umlaute enthalten
  • die Variablennamen stehen in der ersten Tabellenzeile
  • ab der 2. Zeile werden die Rohdaten eingetragen, die möglichst nur Zahlen- und Datumsangaben enthalten sollten
  • bei fehlenden Werten sind die entsprechenden Felder leer zu lassen
  • alle Daten sollten in eine einzige Tabelle geschrieben werden
  • jedes Tabellenfeld darf nur eine einzige Information enthalten; so müssen z.B. Mehrfachdiagnosen in mehrere Spalten aufgeteilt werden (DIAG1, DIAG2, DIAG3 ...)

Beispieltabelle Statistik BlindarmOP

Bearbeiten
PatNr  Geschl  Alter Leukos CRP Tastbef Sono OP  Histo 
---------------------------------------------------------
1      1       12    12000  5   1       1    1   1
2      2       34     8000  8   0       1    1   1
3      1       75    11000  12  1       0    0   0   
4      2        7    17000  2   1       0    1   1
Geschl    1 = männlich 2 = weiblich
Tastbef   1 = VaApp    2 = kein VaApp  0 = nicht untersucht
Sono      1 = VaApp    2 = kein VaApp  0 = nicht untersucht
OP        1 = App      2 = keine App   0 = nicht operiert
Histo     1 = App      2 = keine App   0 = keine Histo vorliegend

Einige wichtige Statistiken

Bearbeiten

Krankenhausdaten

Bearbeiten

Kennzahlen zur stationären Gesundheitsversorgung 2006

Grunddaten           Einheit    Krankenhäuser    Vorsorge- o.Reha-einrichtungen 
-------------------------------------------------------------------------------
Krankenhäuser/
Einrichtungen        Anzahl     2104             1255 
Betten               Anzahl     510767           172717 
Patientenfälle       Anzahl     16 Mio 832883    1 Mio 836 681 
Verweildauer         Tage       8,5              25,6 
Bettenauslastung     %          76,3             74,6

Krankenhausdaten Deutschland (Quelle destatis)

Jahr                1991        1998            2008
--------------------------------------------------------
Anzahl der KH       2411        2263            2067
KH-Betten 1000       666         572             500
Anzahl d.Pat. Mio     14,6        16,8            17,4
Verweildauer Tage     14,0        10,1             8,1

Gesundheitsausgaben in Deutschland 2006 nach Ausgabenträgern

Ausgabenträger                       Milliarden EUR 
---------------------------------------------------
insgesamt                            245  
Gesetzliche Krankenversicherung      140
Private Haushalte, 
Private Organis. ohne Erwerbszweck    33  
Private Krankenversicherung           22 
Soziale Pflegeversicherung            18  
Öffentliche Haushalte                 13 
Arbeitgeber                           10 
Gesetzliche Unfallversicherung         4,1 
Gesetzliche Rentenversicherung         3,6

Vergleich Gesetzliche Krankenkasse (GKV) mit den Privaten Krankenkassen (PKV) in Deutschland 2007

                     GKV      PKV
---------------------------------- 
Versicherte in Mio    70,3      8,6
Einnahmen in Mrd €   155,4     27,6
Ausgaben  in Mrd €   145,5     18,2

Todesursachen

Bearbeiten

Anzahl der Gestorbenen nach ICD-10-Hauptgruppen (Kapitel) Deutschland

                                                            Anzahl der Gestorbenen
Kapitel        Name der Hauptgruppe                         2004      2005      2006 
----------------------------------------------------------------------------------------
Alle Kapitel   Insgesamt                                    818 271   830 227   821 627 
I              Best. infektiöse und parasitäre Krankheiten   11 062    12 061    12 354 
II             Neubildungen (Tumoren,Krebs etc)             214 863   216 928   217 095 
III            Blut, blutbildende Organe, Immunsystem         2 054     2 123     2 044 
IV             Hormone, Ernährung Stoffwechsel               27 041    28 271    26 624 
V              Psychische und Verhaltensstörungen             9 516    11 356    14 145 
VI             Krankheiten des Nervensystems                 17 675    18 555    19 394 
VII            Auge und der Augenanhangsgebilde                   3         1         6 
VIII           Ohr und Warzenfortsatz                            11         9        11 
IX             Krankheiten des Kreislaufsystems             368 472   367 361   358 953 
X              Krankheiten des Atmungssystems                52 500    57 742    54 888 
XI             Krankheiten des Verdauungssystems             42 213    42 787    42 973 
XII            Krankheiten der Haut und der Unterhaut           587       607       677 
XIII           Muskel-Skelett-System und Bindegewebe          1 981     2 024     2 282 
XIV            Krankheiten des Urogenitalsystems             13 246    14 288    15 087 
XV             Schwangerschaft, Geburt und Wochenbett            37        28        41 
XVI            Perinatalperiode                               1 443     1 341     1 390 
XVII           Angeborene Fehlbildungen etc                   1 576     1 528     1 473 
XVIII          Symptome anderenorts nicht klassifiziert      20 682    20 193    19 978 
XIX            Verletzungen, Vergiftungen etc                33 309    33 024    32 212

Diagnosen in der ambulanten Behandlung beim Hausarzt

Bearbeiten

Häufigste Diagnosen in Prozent der Behandlungsfälle in Arztpraxen in Nordrhein (Rang und Anteil). Gliederungsmerkmale: Jahre, Geschlecht, ICD10, Arztgruppe Angezeigte Werte beziehen sich auf: Praxen von Allgemeinmediziner(n)/innen und praktischen Ärzt(en)/innen, Beide Geschlechter, 2006

Diagnosen (Behandlungsanlass)                       Rang/Anteil       Rang Anteil in % 
--------------------------------------------------------------------------------------
I10 Essentielle (primäre) Hypertonie                1                 28,7 
E78 Störungen des Lipoproteinstoffwechsels          2                 23,3 
M54 Rückenschmerzen                                 3                 14,2 
I25 Chronische ischämische Herzkrankheit            4                  9,8 
E11 Typ-II-Diabetes                                 5                  9,2 
E04 Sonstige nichttoxische Struma                   6                  9,0 
E66 Adipositas                                      7                  8,5 
M53 Krankheiten der Wirbelsäule                     8                  7,0 
K76 Sonstige Krankheiten der Leber                  9                  6,8 
E79 Purin- und Pyrimidinstoffwechsels (zB Gicht)   10                  6,7 
I83 Varizen der unteren Extremitäten               11                  6,4 
K29 Gastritis und Duodenitis                       12                  6,3 
M47 Spondylose                                     13                  5,9 
M17 Gonarthrose [Arthrose des Kniegelenkes]        14                  5,5 
J30 Vasomotorische + allerg.Rhinopathie            15                  5,3 
J45 Asthma bronchiale                              16                  5,2 
F32 Depressive Episode                             17                  5,2 
J44 Sonstige chron. obstruktive Lungenkrankheit    18                  5,2 
K21 Gastroösophageale Refluxkrankheit              19                  5,0 
J06 akute Infektionen der oberen Atemwege          20                  4,9 
J20 Akute Bronchitis                               21                  4,9 
M51 Sonstige Bandscheibenschäden                   22                  4,8 
I50 Herzinsuffizienz                               23                  4,5 
M81 Osteoporose ohne pathologische Fraktur         24                  4,2 
I49 Sonstige Herzrhythmusstörungen                 25                  4,1 
F45 Somatoforme Störungen                          26                  4,0 
K80 Gallensteine                                   27                  3,9 
G47 Schlafstörungen                                28                  3,6 
G43 Migräne                                        29                  3,6 
Z25 Impfungen                                      30                  3,5

Arztbesuche pro Jahr

Bearbeiten
Deutschland     17
Tschechien      12 - 14 
Slowakei        12 - 14
Japan           12 - 14
Österreich      10
Schweiz          5,3
Schweden         2 - 3

NNT Number needed to treat Anzahl der notwendigen Behandlungen

Bearbeiten

Wie viel muß ich behandeln um ein Ereignis zu verhindern ?

Je kleiner die NNT desto effektiver die Behandlung

Die Anzahl der notwendigen Behandlungen (en. number needed to treat NNT) ist eine wichtige statistische Maßzahl, die angibt, wie viele Patienten behandelt werden müssen, um das gewünschte Therapieziel bei einem Patienten zu erreichen. Sie ist neben der absoluten und relativen Risikoreduktion ein recht anschauliches Mittel, um den Nutzen einer Behandlung in Zahlen darzustellen. Eine größere NNT bedeutet eine kleinere Risikoreduktion.

NNT wird auch in der Präventivmedizin verwendet und manchmal als Anzahl der notwendigen   Screenvorgänge (en. numbers needed to screen NNS) bezeichnet. In der praktischen Anwendung sollte die NNT mit der NNH (en, numbers needed to harm) in Relation gesetzt werden, d.h., die Anzahl der notwendigen Behandlungen, um das gewünschte Therapieziel bei einem Patienten zu erreichen wird mit der notwendigen Anzahl Behandlungsvorgänge, um bei einem Patienten einen Schaden zu verursachen, verglichen.

Berechnung

Bearbeiten

Man kann die Zusammenhänge sehr gut mit Hilfe einer Vierfeldertafel illustrieren. Diese stellt eine Möglichkeit der Auswertung einer wissenschaftlichen Untersuchung dar. Idealerweise handelt es sich um eine prospektive, kontrollierte und randomisierte Studie.

Man vermutet, dass zwei mögliche Maßnahmen verschieden häufig zu einem bestimmten Ziel führen (Zielpunkt). Verglichen werden zwei (Patienten)gruppen, die sich nur durch die angewandte Maßnahme unterscheiden. Andere Einflussfaktoren wurden durch die Randomisierung ausgeschlossen. Man ermittelt durch eine standardisierte Untersuchung, bei wie vielen Patienten der jeweiligen Gruppe das Ziel erreicht wurde und bei wie vielen es verfehlt wurde.
Zielpunkt
erreicht nicht erreicht
Maßnahme 1 A B
Maßnahme 2 C D

Dabei steht:

  • A für die Anzahl der Patienten, bei denen mit Maßnahme 1 das Ziel erreicht wurde,
  • B für die Anzahl der Patienten, bei denen mit Maßnahme 1 das Ziel nicht erreicht wurde,
  • C für die Anzahl der Patienten, bei denen mit Maßnahme 2 das Ziel erreicht wurde,
  • D für die Anzahl der Patienten, bei denen mit Maßnahme 2 das Ziel nicht erreicht wurde.

Die ARR (  Absolute Risikoreduktion) berechnet sich dann wie folgt:

 

Eine positive Absolute Risikoreduktion bedeutet eine Überlegenheit von Maßnahme 1 gegenüber Maßnahme 2. Hat die Absolute Risikoreduktion einen negativen Wert, bedeutet dies eine Unterlegenheit von Maßnahme 1. Für die Aussagekraft der ARR ist weiterhin ihr   Konfidenzintervall wichtig.

Die NNT berechnet sich wie folgt:

 

oder

 

Eine negative ARR würde man nicht als negative number needed to treat, sondern als positive number needed to harm (NNH) darstellen.

 

Rundung: Will man die NNT ohne Nachkommastellen angeben, so empfiehlt es sich, aufzurunden. Beispiel:

  • 4,2304 Patienten müssen behandelt werden, damit ein Patient weniger stirbt
  • (mindestens) 5 Patienten müssen behandelt werden, damit ein Patient weniger stirbt

Das normalerweise übliche Abrunden hätte zur Folge, dass der Therapieeffekt überschätzt würde.

Wertigkeit

Bearbeiten

Wichtig ist, dass die Werte der NNT bzw. der ARR streng genommen zunächst nur für die Studie gelten, innerhalb der sie ermittelt wurden. Die   externe Validität der Studie beschreibt die Übertragbarkeit nach außen - das heißt auf einen speziellen Fall oder auf eine allgemeingültige Aussage. Daher ist es wichtig, dass neben der NNT auch die Gruppen und der Zielpunkt genau beschrieben werden. Beispiel:

Werden männliche weiße Patienten im Alter zwischen 23 und 34 Jahren, die an Schnupfen erkrankt, sonst aber kerngesund sind, für sieben Tage mit 5 g von Medikament A behandelt, so müssten 100.000 Patienten behandelt werden, damit 1 Patient mehr nach 10 Tagen schnupfenfrei wird, als es ohne irgendeine Behandlung der Fall gewesen wäre.
Bearbeiten


Medizinisch-Statistische Fehleinschätzungen

Bearbeiten

Spermienqualität

Bearbeiten

Jahrelang wurde behauptet, die Spermienqualität in Deutschland nehme ab, und versucht, dies mit allerlei Ursachen zu erklären. Neure Studien zeigen, daß die Aussagen statistisch nicht haltbar sind. Siehe http://www.aerztezeitung.de/medizin/krankheiten/urologische-krankheiten/?sid=496560 ( Professor Eberhard Nieschlag beim "European Congress of Endocrinology" (ECE) in Berlin )


Literatur

Bearbeiten
  • Medizinische Statistik, Herbert Immich , Schattauer Verlag
Leider nur noch antiquarisch verfügbar, didaktisch hervorragend gemacht, mit sehr vielen praktischen medizinischen Beispielen. Sehr empfehlenswert.
  • Basiswissen Medizinische Statistik (Springer-Lehrbuch) (Taschenbuch) von Christel Weiß
  • Biomathematik, Statistik und Dokumentation: Eine leichtverständliche Einführung. Nach den Gegenstandskatalogen für den 1. und 2. Abschnitt der ärztlichen Prüfung von Volker Harms
  • Einführung in die Medizinische Statistik (Springer Taschenbuch) von Ralf-Dieter Hilgers (Autor), Peter Bauer (Autor), Viktor Scheiber (Autor)
  • Methodik klinischer Studien: Methodische Grundlagen der Planung, Durchführung und Auswertung (Taschenbuch) von Martin Schumacher (Autor), Gabriele Schulgen (Autor)
  • Die medizinische Doktorarbeit (Broschiert) von Claudius Diez (Autor)

Linklisten Statistik

Bearbeiten

Allgemeines

Bearbeiten

Gesundheitsstatistik

Bearbeiten

Medizinisch-Statistische Beratung im Internet

Bearbeiten