Die Qualität jeder Transkription, Sprechertrennung und Textanalyse hängt direkt von der Audioqualität der Aufnahme ab. Deshalb nutzen Sie gute, nicht störende, tragbare Mikrofone bei jeder Sitzung.
Jede Stufe dieser Pipeline verstärkt oder akkumuliert Fehler der vorherigen. Schlechte Audioqualität am Eingang degradiert alle nachgelagerten Outputs — unabhängig von der Qualität der verwendeten Modelle.
Schlechtes Audio am Eingang → Fehler in der Transkription → falsche Sprecherzuordnungen → unzuverlässige Dokumentation → eingeschränkte KI-Qualität.
Die Anforderungen in therapeutischen Settings unterscheiden sich fundamental von Meetings oder Callcentern.
Technik darf die therapeutische Beziehung nicht dominieren
Sichtbare, grossformatige Aufnahmegeräte auf dem Tisch beeinflussen die Sitzungsatmosphäre. Viele Klienten fühlen sich beobachtet oder «aufgezeichnet» — die natürliche Offenheit des Gesprächs leidet.
Kleine, körpernahe Wearable-Mikrofone werden nach wenigen Minuten nicht mehr wahrgenommen. Die Sitzung bleibt im Vordergrund — nicht die Technik.
Software-Diarization allein reicht für therapeutische Realität nicht aus
Moderne Diarization-Modelle sind leistungsstark — aber sie haben eine entscheidende Grenze: Sie können nur trennen, was akustisch trennbar ist. In typischen Therapieräumen ohne Einzelspuraufnahmen versagt die reine Software-Diarization bei:
Separate drahtlose Mikrofone lösen dieses Problem physisch — nicht algorithmisch. Jeder Sprecher hat sein eigenes Signal. Das Ergebnis: präzise Sprecherlabels, korrekte Attributionen im Transkript, zuverlässige Dokumentation.
Für den klinischen Einsatz empfehlen wir folgende drahtlose Systeme — ein Sender pro Person, der am Körper getragen wird (Clip-on/Lavalier).
Alle genannten Geräte werden als eigenständige Audioquellen erkannt und können direkt im Aufnahme-Tab der App ausgewählt werden.
Die folgenden Konfigurationen liefern keine klinisch brauchbaren Transkriptionen und werden von uns nicht unterstützt.
Sechs einfache Schritte für konsistente Aufnahmequalität.
Therapeut und Klient tragen je einen eigenen Sender. Das ist die einzige zuverlässige Basis für Sprechertrennung.
Ideale Position: Brusttasche, Revers oder Hemdkragen — ca. 20–30 cm vom Mund entfernt, frei von Kleidungsreibung.
Kurz vor Beginn den Ladestand kontrollieren. Die meisten Systeme zeigen den Status per LED oder App.
Klimaanlage, Lüfter und Strassengeräusche reduzieren die Transkriptionsqualität spürbar. Ein ruhiger Raum ist die kostengünstigste Verbesserung.
Schal, Jacke oder loses Gewebe über dem Mikrofon erzeugt störende Geräusche. Kurz prüfen bevor die Aufnahme startet.
Im Aufnahme-Tab das korrekte Audiogerät aus dem Dropdown wählen — nicht das Standard-Laptop-Mikrofon.
Audiodaten sind die sensibelsten Daten im System — entsprechend behandeln wir sie.