Generische KI-Systeme wurden entwickelt, um Sprache zu verarbeiten — nicht um therapeutische Verantwortung zu tragen.
Psychotherapie ist kein gewöhnlicher Datenkontext. Sie betrifft hochsensible Informationen, asymmetrische Vertrauensbeziehungen und potenziell vulnerable Personen — und stellt damit andere Anforderungen an KI-Systeme als fast jeder andere Anwendungsbereich.
In der Psychotherapie entstehen Informationen, die selbst innerhalb medizinischer Systeme nur einem engen Personenkreis zugänglich sind: Beziehungsmuster, Traumata, Diagnosen, Krisensituationen, familiäre Dynamiken, Suizidalität. Diese Inhalte folgen einer anderen Logik als allgemeiner Text — sie sind kontextuell, longitudinal und klinisch bedeutsam.
Die zentrale Frage lautet deshalb nicht mehr, ob generative KI genutzt wird, sondern unter welchen fachlichen, ethischen und datenschutzrechtlichen Bedingungen.
Der Einsatz generativer KI im Gesundheitsbereich ist keine Zukunftsperspektive mehr — er ist Gegenwart. Die verfügbare Forschung zeichnet ein klares Bild rascher Verbreitung, begleitet von wachsenden Bedenken in der Fachgemeinschaft.
der Psychiaterinnen und Psychiater nutzen ChatGPT-3.5 professionell, 33 % GPT-4. 70 % erwarten Effizienzgewinne in der Dokumentation.[2]
der Kinder- und Jugendpsychiaterinnen setzen ChatGPT-4o bereits beruflich ein, ebenso 40 % der Psychologinnen — trotz klarer Vorbehalte bei Datenschutz und Ethik.[3]
der Psychologinnen gaben 2025 an, keine KI zu nutzen — 2024 waren es noch 71 %. Meistgenannte Bedenken: Datenschutz (67 %), gesellschaftlicher Schaden (64 %), Verzerrungen (63 %).[1]
der 18–21-Jährigen nutzen generative KI für Ratschläge zur psychischen Gesundheit. 92,7 % bewerten sie als hilfreich — ohne dass diese Einschätzung klinisch validiert wäre.[4]
Die Daten zeigen: Die Frage ist nicht mehr, ob generative KI in der psychologischen Praxis Einzug hält. Sie ist bereits da. Die eigentliche Herausforderung liegt in der qualitativen Differenzierung — zwischen KI-Einsatz, der klinische und ethische Anforderungen erfüllt, und solchem, der sie ignoriert.
Sprachmodelle wie ChatGPT & Co. behandeln Text statistisch — isoliert, ohne Beziehungskontinuität, ohne das Wissen um das, was in Sitzung 2 anders war als in Sitzung 9.
Psychotherapie funktioniert anders. Sie entfaltet sich über Verlauf, Wiederholung, implizite Muster und langfristige Dynamiken. Ob eine Aussage klinisch relevant ist, hängt oft nicht vom Wortlaut allein ab — sondern davon, wann sie im Verlauf auftaucht, wie häufig sie wiederkehrt und in welchem Beziehungskontext sie steht.
Ohne Zugang zum Verlauf kann ein KI-System diese Dimension nicht abbilden. Weidinger et al. (2021) zeigen darüber hinaus, dass grosse Sprachmodelle den Eindruck von Empathie und Verständnis erzeugen, ohne die strukturelle Kapazität zu besitzen, therapeutische Verantwortung zu tragen — ein Risiko, das im klinischen Kontext besonderes Gewicht hat.[7]
Es beantwortet Fragen — aber es kennt keinen Fall.
Fast jede Diskussion über generative KI in der Therapie landet schnell bei DSGVO und Serverstandorten. Das ist berechtigt — aber es greift zu kurz.
Das tiefere Problem: Generische Sprachmodelle verstehen therapeutischen Kontext strukturell nicht. Sie können depressive Symptome sprachlich korrekt beschreiben, ohne die klinische Bedeutung eines Verlaufs zu erfassen. Sie können plausibel klingende Antworten formulieren — ohne dass diese klinisch valide sind.
Sprachliche Plausibilität ist nicht dasselbe wie klinische Validität.
Torous & Topol (2025) stellen in The Lancet fest, dass die Evidenzlage für generative KI in der psychischen Gesundheitsversorgung sich noch in einer frühen Phase befindet — und mahnen zu sorgfältiger klinischer Prüfung vor dem Einsatz.[6] Hillebrand & Baumeister (2025) bestätigen: Fachpersonen erleben KI-Tools als unterstützend — mit klar gezogenen Grenzen beim kontextuellen Urteilsvermögen, das im therapeutischen Prozess unersetzbar bleibt.[5]
Blease und Rodman (2025) formulieren den Kern des Problems: Die «glatte» Sprachfähigkeit generativer Modelle ist kein Indikator für klinische Angemessenheit — Systeme können überzeugend formulieren und dennoch inhaltlich falsch oder risikoreich sein, besonders in vulnerablen Situationen.[9] Pandey (2024) ergänzt: Grosse Sprachmodelle begünstigen anthropomorphe Zuschreibungen und können in bestimmten Situationen kontextuell unzureichende Ausgaben erzeugen — ohne dass dies für Nutzende erkennbar wäre.[10] Der Stand der Forschung selbst macht die Lücke sichtbar: 88 % der KI-Studien im Mental-Health-Bereich sind experimentell angelegt und untersuchen isolierte Fähigkeiten — nicht klinische Angemessenheit in realen Versorgungskontexten.[11][12]
Für allgemeine Textarbeit ist das kein Problem. In der Psychotherapie kann es eines werden — besonders dann, wenn KI-generierte Aussagen ohne klinische Reflexion übernommen werden.
Wer ein allgemeines Sprachmodell sinnvoll nach einem Fall befragen will, muss Kontext mitgeben: Anliegen, Verlauf, Diagnose, Medikation, Situation. Das bedeutet in der Praxis: personenbezogene Gesundheitsdaten gehen an externe Server — ohne Pseudonymisierung, ohne Kontrolle über Weiterverarbeitung.
Die Fachgemeinschaft nimmt dieses Risiko wahr: In einer Umfrage der American Psychological Association (2025) nannten 67 % der befragten Psychologinnen und Psychologen Datenschutz als ihr wichtigstes Bedenken beim KI-Einsatz, gefolgt von gesellschaftlichem Schaden (64 %), algorithmischen Verzerrungen (63 %) und mangelnder Transparenz (52 %).[1]
Abseits jeder DSGVO-Frage entsteht damit ein strukturelles Problem des Vertrauens: zwischen Therapeutin und Klient, und zwischen Klient und dem System, in dem seine Inhalte landen.
Der verantwortungsvolle Einsatz generativer KI in der psychologischen Praxis berührt gleichzeitig Datenschutzrecht, KI-Governance und berufsethische Verpflichtungen. Diese drei Ebenen greifen ineinander — und sie formulieren keine Empfehlungen, sondern verbindliche Anforderungen.
Art. 5, 12–14, 25, 32 DSGVO · Art. 6–8 DSG
Art. 5, 50, 52, 53 EU AI Act (2024)
In vielen KI-gestützten Lösungen wird die Sitzungsaufnahme vollständig an externe Infrastruktur übertragen. Das Audio verlässt das Gerät — und mit ihm alles, was in der Sitzung gesagt wurde.
Der datenschutzrechtlich sauberere Ansatz: Transkription lokal, auf dem Gerät der Fachperson, bevor irgendetwas übertragen wird. Das Audio wird nie gespeichert, nie weitergegeben, und verlässt den Arbeitsspeicher direkt nach der Transkription.
Das ist kein Zusatzfeature. Es ist die Voraussetzung dafür, dass Sitzungsaufnahmen in der Psychotherapie überhaupt verantwortbar werden.
Hans Jonas (1979) bestimmt Verantwortung als Verpflichtung, für die absehbaren Wirkungen des eigenen Handelns einzustehen — insbesondere dort, wo technisches Handeln schwer überschaubare Wirkungszusammenhänge erzeugt.[17] Unter den Bedingungen generativer KI — nicht einsehbarer Verarbeitung, probabilistischer Ausgabe — lässt sich diese Verantwortung nicht durch Absicht oder Vertragswerk allein sicherstellen. Sie muss im Design strukturell verankert sein.
Viele Anbieter lösen das Datenschutzproblem durch Auftragsverarbeitungsverträge, Zertifizierungen und Versprechen. Das ist besser als nichts — aber es bleibt eine vertragliche Absicherung, keine technische. Im Zweifelsfall hängt der Schutz von Klientendaten an der Integrität eines externen Anbieters.
Datenschutz by Architecture bedeutet das Gegenteil: Klientendaten verlassen das Gerät nur in einer Form, die für Dritte strukturell nicht lesbar ist — pseudonymisiert, verschlüsselt, ohne dass auch der Anbieter selbst Zugang hätte.
Nicht weil es vereinbart wurde. Sondern weil es technisch nicht anders geht.
KI kann Muster sichtbar machen, die im Gespräch unsichtbar bleiben. Sie kann Strukturen aus Sitzungsverläufen extrahieren, Interventionen vorschlagen, Dokumentation beschleunigen. Das ist real und wertvoll.
Aber sie diagnostiziert nicht. Sie entscheidet nicht. Sie trägt keine klinische Verantwortung.
Das ist keine Schwäche — es ist die einzig seriöse Rahmung. KI-Werkzeuge, die diesen Unterschied verwischen oder implizit überschreiten, sind kein Fortschritt.
KI kann Muster sichtbar machen. Die therapeutische Verantwortung bleibt beim Menschen.
Generative KI wird Teil professioneller therapeutischer Arbeit werden. Das ist keine These mehr — es ist eine Beobachtung des Feldes, bestätigt durch eine wachsende Zahl empirischer Studien.
Die zentrale Frage ist nicht mehr, ob generative KI genutzt wird, sondern unter welchen fachlichen, ethischen und datenschutzrechtlichen Bedingungen. Diese Frage ist keine technische — sie ist eine klinische und professionell-ethische.
Herzog und Blank (2024) beschreiben diesen Engpass als «Principles-to-Practice Gap»: Normen wie Transparenz, Verantwortlichkeit und menschliche Aufsicht sind breit anerkannt — aber selten in konkrete technische und organisatorische Strukturen übersetzt, die im Praxisalltag handlungsleitend sind.[16] Verantwortungsvolle KI-Nutzung bleibt so häufig eine individuelle Aushandlungsleistung — ohne systemische Unterstützung.
mentalhealthGPT wurde aus dem Anspruch entwickelt, genau diese Lücke zu schliessen — nicht durch Versprechen, sondern durch Architektur.
Die Nutzung allgemeiner Sprachmodelle für Therapienotizen ist datenschutzrechtlich problematisch: Klientendaten würden im Klartext an externe Server übertragen — ohne Pseudonymisierung und ohne Kontrolle über Weiterverarbeitung. Zudem fehlt diesen Systemen der longitudinale Fallkontext, der für klinisch fundierte Unterstützung notwendig wäre.
Generische Sprachmodelle sind nicht für den Einsatz mit Gesundheitsdaten ausgelegt. Der Transfer personenbezogener Klientendaten an externe Server ohne Pseudonymisierung ist nach DSGVO und Schweizer DSG problematisch. DSGVO-konforme KI-Unterstützung erfordert eine Architektur, bei der Klientendaten das Gerät nur pseudonymisiert und verschlüsselt verlassen.
Klinisch spezialisierte Systeme unterscheiden sich in drei wesentlichen Punkten: Sie führen einen longitudinalen Fallkontext über alle Sitzungen hinweg. Sie pseudonymisieren Klientendaten automatisch lokal, bevor irgendetwas das Gerät verlässt. Und sie sind auf klinische Fachsprache, Diagnosekriterien und therapeutische Konzepte spezialisiert — nicht auf allgemeine Sprachkompetenz.
Dieser Beitrag wurde u.a. durch folgende wissenschaftliche Arbeit informiert:
Wildhaber-Wälchli, P. (2026).
Ethik, Sicherheit und klinische Anforderungen an KI-Systeme in der Psychologie.
Bachelorarbeit, IU Internationale Hochschule.
30 Tage kostenlos testen — alle Features, keine Kreditkarte, keine Datenweitergabe. Oder live in einer Demo erleben.