Das Modellprojekt der Techniker Krankenkasse (TK), das kürzlich abgeschlossen werden konnte, ist in hohem Maße bemerkenswert. Erstmals hat sich hier eine gesetzliche Krankenkasse bereit gefunden, das System der ambulanten psychotherapeutischen Versorgung mit sorgfältiger Forschungsmethodik zu untersuchen. Es ging um die Frage, ob ein in engen Abständen vorgenommenes Monitoring von ambulanten Psychotherapie-Patienten und eine daran gekoppelte Therapie-Genehmigung einen geeigneten Ansatz für eine Alternative zum bislang üblichen Antrags- und Gutachterverfahren bietet. Das Monitoring wurde in der Studie durch psychodiagnostische Routinefragebögen, auch online, durchgeführt. Das Antrags- und Gutachterverfahren, welches in der Kontrollgruppe (KG) eingesetzt wurde, entsprach der Form, wie sie mit den Psychotherapierichtlinien und Psychotherapie-Vereinbarungen festgeschrieben ist. Hintergrund der Studie ist u.a., dass das Antrags- und Gutachterverfahren zwar seit über vierzig Jahren in beinahe unveränderter Form den Standard darstellt, dass es aber immer wieder Gegenstand von Kritik ist, weil es als sehr rigide, umständlich und aufwändig empfunden wird und weil seine Validität bezweifelt wird.
Vorweg sei erwähnt, dass die Ergebnisse der Studie die hoch gesteckten Erwartungen von vielen Kritikern des Gutachterverfahrens nicht erfüllen konnten (im Gegenteil). Allerdings bietet die Studie umfangreiche Erfahrungen, um die psychotherapeutische Versorgungsforschung zu verbessern, und sie liefert vielfältige Daten, die die Diskussionen um die Fortentwicklung der ambulanten psychotherapeutischen Versorgung bereichern werden
Methodik und Inhalte der Studie: Was wurde gemacht?
Der Evaluationsplan der unabhängigen Forschergruppe um Prof. Werner W. Wittmann (Mannheim) und Prof. Wolfgang Lutz (ehem. Bern, jetzt Trier) sah eine quasi-experimentelle (clusterrandomisierte) Feldstudie vor, also ein anspruchsvolles Design, das im laufenden Routinebetrieb bei niedergelassenen PsychotherapeutInnen in drei KV-Bezirken im Versorgungsalltag realisiert wurde. Die Studienergebnisse des Projektes werden im vorliegenden Abschlussbericht umfassend dokumentiert ebenso wie der resultierende Rohdatensatz der Ergebnisdaten, der nach den Vereinbarungen der TK mit den KVen, interessierten ForscherInnen zur Verfügung stehen wird.
Die versorgungsnahe Umsetzung der Studie war auf jeden Fall von Vorteil, weil es ja darum ging, ein Modell für die Versorgungsroutine zu prüfen. Sie hat sich aber letztlich als schwere Hypothek für die Studie erwiesen. Denn der Studie und den Initiatoren wurde von Beginn an unterstellt, auf heimlichem Weg eine bestimmte Form von Psychotherapie (Kurzzeit-Verhaltenstherapie) fördern und andere Psychotherapien benachteiligen zu wollen. Dementsprechend wurden die niedergelassenen PsychotherapeutInnen nicht nur von der Techniker Krankenkasse und ihrer Kassenärztlichen Vereinigung zur Studienteilnahme geworben, sondern sie wurden auch von Psychotherapie-Verbänden und von Kammern informiert. Und es hat sich (mit beeindruckenden, aber durchaus plausiblen Unterschieden je nach KV-Region) erwartungsgemäß nur eine bestimmte Auswahl an PsychotherapeutInnen zur freiwilligen Teilnahme an der Studie gemeldet. Die selbst-selektierten StudientherapeutInnen wurden dann zwar sachgerecht randomisiert, allerdings zeigten sich die genannten Einflüsse wiederum bei der weiteren Auswahl/Selektion der PatientInnen, die für die Auswertung zur Verfügung standen.
Die erwähnten Widerstände im Feld dürften nicht zuletzt für die erheblichen Probleme bei der Rekrutierung verantwortlich gewesen sein. Denn die ursprünglich angestrebte verwertbare Stichprobengröße von 1.000 vollständigen Datensätzen wurde in der zunächst geplanten Projektlaufzeit bis 2007 nicht erreicht und auch in der daraufhin erfolgten, für vergleichbare Projekte außerordentlich großzügigen Laufzeitverlängerung von weiteren vier Jahren konnte diese Zahl bei weitem nicht erreicht werden.
Von den 4.452 TK-PatientInnen haben die StudientherapeutInnen nur 2.177 PatientInnen um eine Studienteilnahme gebeten. Davon haben 469 abgesagt, 1.708 haben einer Teilnahme zugestimmt. Von dieser Ausgangsstichprobe, deren Repräsentativität für die TK-PatientInnen durchaus in Frage gestellt werden kann, blieben am Ende der Studie – je nach Zählung – 300 (t1-, t2- und t3-Daten) vollständige oder 597 (t1- und t2-Daten) bzw. 468 (t- und t3-Daten) verwertbare Datensätze. Zweierlei muss vor Analyse der Ergebnisse aus dieser Stichprobenbetrachtung festgehalten werden: Von den TK-PatientInnen der teilnehmenden TherapeutInnen gingen in die Ergebnisauswertung nur 6,7% oder 13,4% bzw. 10,5% ein. Und die TherapeutInnen der Kontrollgruppe hatten deutlich weniger PatientInnen aus ihren TK-PatientInnen ausgewählt/selektiert als die TherapeutInnen der Interventionsgruppe (etwas mehr als halb so viele). Dies lässt wiederum die Vergleichbarkeit der PatientInnenstichproben von Interventions- und Kontrollgruppe fraglich erscheinen.
Über die Selektionskriterien der TherapeutInnen ist nichts bekannt, darüber kann man trefflich spekulieren, zumal die Selektionsanteile bei den KG-TherapeutInnen deutlich größer sind als bei den IG-TherapeutInnen. Allerdings geben die Studienautoren in der Drop Out-Analyse interessante Hinweise darauf, wie sich die PatientInnen mit vollständigen Datensätzen von denen unterscheiden, die in der Ausgangsstichprobe erfasst sind: So ist die Problembelastung bei denjenigen mit vollständigen Datensätzen größer als bei den sogenannten Drop Out-Probanden, und in der Tendenz ist auch das Alter dieser PatientInnen höher sowie die Anzahl der Jahre seit Erstmanifestation der Erkrankung.
Feldforschung zwingt gelegentlich zu erheblichen Zugeständnissen bei den üblichen wissenschaftlichen Standards an das, was im Feld machbar ist. Bei der vorliegenden Studie waren – entsprechend den Verträgen zwischen TK und KVen – beispielsweise keine separaten Auswertungen für die einzelnen Therapieverfahren zugelassen, und es konnten auch keine entsprechenden Gewichtungen (Adjustierungen) oder geschichtete Auswertungen vorgenommen werden. In die späteren Auswertungen, beispielsweise für die Therapiedauer-Unterschiede, zwischen IG und KG gingen also alle Therapien ein, ohne dass man etwa hätte berücksichtigen können, dass 31% der beteiligten TherapeutInnen tiefenpsychologisch ausgerichtet waren (etwas größerer Anteil in der KG). 1% psychoanalytische Psychotherapien dürften nicht ins Gewicht gefallen sein.
Für die Unterschiedsprüfungen, in die als Hauptinstrumente patientenseitig v.a. das Brief Symptom Inventory (BSI), das Inventar Interpersoneller Probleme (IIP-D) und das Beck Depressions Inventar eingingen, wurde eine bislang wenig verbreitete Berechnungsmethode der integrierenden Ergebnisdarstellung gewählt. Es wurden sogenannte multiple Ergebniskriterien berechnet, in die die Werte der verschiedenen Instrumente nach einem vorgegebenen Modus z-standardisiert eingerechnet wurden.
Neben der zentralen Studienfrage, ob das Monitoring dem Gutachterverfahren überlegen ist, sollte die Studie zunächst auch dazu dienen, das Monitoring-System auf der Basis von Routinefragebögen für TherapeutInnen und PatientInnen zu entwickeln und in der Fläche zu erproben. Es sollte für TherapeutInnen und PatientInnen zeitnah objektive Rückmeldungen über die Qualität des Therapieverlaufs liefern. Dazu kann man festhalten, dass das entwickelte methodisch anspruchsvolle System von den TherapeutInnen und auch den PatientInnen der Interventionsgruppe in den Zufriedenheitsbefragungen durchaus geschätzt wurde.
Studienergebnisse
Nach den differenziert dargestellten Auswertungen kann hinsichtlich der zentralen Studienfrage festgehalten werden, dass sich für die Hauptzielgröße kein Unterschied zwischen Interventions- und Kontrollgruppe feststellen ließ, weder beim Vergleich der Verbesserungen zum Therapieende, noch bei der Prüfung der Verbesserungen zur Jahreskatamnese. D.h. die Hypothese einer Überlegenheit des Therapie-Monitorings gegenüber dem Gutachterverfahren als Genehmigungsmethode, d.h. einer größeren Effektivität der Therapien, konnte nicht bestätigt werden. Auch die sorgfältige Berücksichtigung möglicher Störvariablen (Confounder) konnte diesen Befund nicht ändern. Das zweite Studienziel richtete sich auf die Frage, ob das Monitoring zu einer besseren Wirtschaftlichkeit in der Therapie beiträgt, etwa weil die Therapien kürzer sind oder weil die PatientInnen weniger Arbeitsunfähigkeitszeiten haben. Diese Frage konnte nicht geprüft werden, weil hierzu von Seiten der TK keine Daten vorlagen. Festzuhalten ist in diesem Zusammenhang allerdings, dass die Therapien (einschließlich Probatorik) bei den TherapeutInnen der Interventionsgruppe signifikant und deutlich länger dauerten (!) als bei denen der Kontrollgruppe (IG: Mittelwert = 41,3, Median 41,0; KG: Mittelwert 37,0, Median 30,0).
Neben der Untersuchung der erwähnten zentralen Hypothesen wurde die Studie auch genutzt, um verschiedene interessierende Fragen explorativ zu untersuchen. Hier gab es interessante, allerdings auch teilweise schwer zu interpretierende Befunde. Zwei Punkte seien kurz erwähnt.
So zeigte sich beispielsweise, dass bei allen Therapien, von denen Katamnese-Daten vorliegen (egal ob sie von Interventions- oder Kontrollgruppen-TherapeutInnen durchgeführt wurden), im Durchschnitt sehr deutliche Verbesserungen in dem erwähnten integrierenden Ergebnismaß erzielt werden konnten (Effektgröße/Effektstärke d=1,0). Dieses Ergebnis kann man als Bestätigung der hohen Wirksamkeit von Psychotherapie verstehen. Allerdings muss dabei auch der eingangs erwähnte erhebliche Drop Out der ProbandInnen und die Selektivität der Stichprobe berücksichtigt werden, so dass die Frage der Generalisierbarkeit auf alle Psychotherapie-PatientInnen nicht sicher beantwortet werden kann. Und man muss berücksichtigen, dass Katamnese-Daten bevorzugt von denjenigen PatientInnen vorlagen, die zum Therapieende größere Verbesserungen gezeigt hatten. Ob es fachlich zu rechtfertigen ist, durch entsprechende Adjustierung der Katamnese-Daten den Einfluss dieses Selektionseffektes rechnerisch zu kompensieren, kann man sicher diskutieren.
Interessant ist auch die Feststellung zum gesundheitsökonomischen Nutzen von Psychotherapie, die im Ergebnisbericht vorgenommen wird. Da heißt es, es ergibt sich ein gesamtgesellschaftlicher Nutzen von 2 bis 4 Euro pro in die Therapie investiertem Euro. Auf den ersten Blick eine durchaus beeindruckende Aussage. Allerdings konnten von der Techniker Krankenkasse aus verschiedenen Gründen, wie bereits erwähnt, keine gesundheitsökonomischen Daten zu den Probanden vorgelegt werden. Dieses Manko wurde von den Evaluatoren dadurch umgangen, dass die gefundenen Verbesserungen bei den Effektivitätsmaßen in der Katamnese-Stichprobe per Analogschluss (auf der Basis von Ergebnissen anderer Studien) in einen gesundheitsökonomischen Nutzen der ambulanten Psychotherapie für die Gesellschaft umgerechnet wurden. Ob und inwieweit dieses Vorgehen methodisch-inhaltlich zu rechtfertigen ist, auch darüber kann man durchaus geteilter Ansicht sein.
Schlussfolgerungen: Was bleibt?
Angesichts der wachsenden Bedeutung von psychischen Störungen im Krankheitsspektrum und ihrer häufig zitierten erheblichen volkswirtschaftlichen Folgen ist es wichtig, dass hier erstmals eine Untersuchung der Potentiale der ambulanten (Richtlinien-)Psychotherapie und möglicher Weiterentwicklungen in der realen Versorgung vorgenommen wurde. Der Techniker Krankenkasse gebührt große Anerkennung, dass sie dieses Modellprojekt und seine sorgfältige Evaluation finanziert hat.
Das Monitoringverfahren, so bestätigt die vorliegende Studie, ist keine Alternative zum Antrags- und Gutachterverfahren, zumindest nicht in der hier erprobten Art und Weise. Die Diskussion um das Antrags- und Gutachterverfahren und um die geeignete Form der ambulanten psychotherapeutischen Versorgung muss also weitergehen. Denn Psychotherapie ist wirksam. Das wurde schon in vielen Studien belegt und auch die vorliegende Untersuchung liefert dazu als Feldstudie deutliche Hinweise.
Auch wenn die Ergebnisse der Studie auf den ersten Blick bescheiden sind, sie zeigen umso deutlicher, dass psychotherapeutische Versorgungsforschung im Feld möglich ist und dass sie auch in der Lage ist, aktuelle Entwicklungsperspektiven zu untersuchen. Deutlich werden auch die Herausforderungen von psychotherapeutischer Versorgungsforschung, die aber durchaus zu bewältigen sind, wenn alle Beteiligten sich darauf verständigen. Die Studie schließlich, dass nicht unbedingt jede kreative Idee für neue Modelle der Versorgung, die in der Theorie oder in der Laborforschung vielversprechend scheint, im Versorgungsalltag in gleicher Weise effektiv ist. Insofern bleibt zu wünschen, dass in diesem Feld weitere Entwicklungen angeregt werden und dass sie sorgfältig und unabhängig evaluiert werden, bevor sie in der Routine eingesetzt werden.
Vorstand der Deutschen Gesellschaft für Verhaltenstherapie
[1] Abschlussbericht zum Modellvorhaben nach § 63 Abs. 1 SGB V (online unter www.tk.de - Juni 2011)