MacWhisper: Lokale Transkription für sensible Daten

Mit MacWhisper können Transkripte komplett lokal auf dem eigenen Mac erstellt werden.

2023 habe ich an dieser Stelle zum ersten Mal von MacWhisper berichtet. Inzwischen ist viel passiert. Zeit also, diesen wertvollen Softwarebegleiter nochmals vorzustellen.

Als Knowledge Facilitator beschäftige ich mich täglich mit der Frage, wie wir Wissen effektiv erfassen und teilen können. Eine der grössten Herausforderungen dabei ist die Verarbeitung von Audio- und Videomaterial – besonders wenn es sich um vertrauliche Inhalte handelt.

Zwar bieten KI-Tools ganz viele Möglichkeiten, Texte aus Audios und Videos zu extrahieren. Oft werden Transkripte auch direkt auf dem Video- oder Podcast-Portal angeboten.

Das Problem: In ChatGPT und Co. geschieht die Transkription in der Cloud. Und genau da möchte ich gewisse Daten aus PLAUD-Recordings, Sitzungen, Gesprächen, Interviews nicht hinsenden. Zu vertraulich.

Ich brauche also eine Möglichkeit, Audios und Videos lokal zu transkribieren. Genau dafür nutze ich MacWhisper.

In MacWhisper können verschiedene Tasks gestartet werden.

Lokale Verarbeitung als Schlüsselfunktion

MacWhisper bietet hier eine überzeugende Lösung: Die App ermöglicht es, Transkripte komplett lokal auf dem eigenen Mac zu erstellen. Dazu wird eine Version von OpenAIs Whisper lokal als Modell heruntergeladen. Die Transkription kann dann ohne Netzverbindung gestartet werden. Dazu lade ich einfach die Mediendatei in die App, starte die Transkription und wenig später liegt der Text vor mir.

Die Vielseitigkeit der App zeigt sich auch in der Möglichkeit, auch YouTube-Videos direkt zu transkribieren oder Systemaudio direkt aufzunehmen, was beispielsweise für Meeting-Mitschriften sehr praktisch ist. Ein besonders nützliches Feature ist die manuelle Sprecherzuordnung, die für übersichtlichere Exportdateien sorgt.

Bei der Transkription werden verschiedene Sprecher automatisch erkannt.

Systemanforderungen und KI-Integration

Voraussetzung ist allerdings ein leistungsfähiger Mac mit M-Prozessor und idealerweise mehr als 8 GB RAM, besonders wenn man die fortgeschrittenen Modelle (Medium und Large) nutzen möchte. Diese Investition zahlt sich aber aus, denn die erzeugten Transkripte bilden eine grossartige Grundlage für die Weiterverarbeitung.

Optional können über APIs zusätzliche Cloud-KI-Modelle eingebunden werden: MacWhisper unterstützt nicht nur OpenAI's Modelle wie GPT-4 und GPT-4 Turbo, sondern auch Claude von Anthropic und ermöglicht sogar die Nutzung eigener GGML-Modelle. Für internationale Zusammenarbeit besonders wertvoll: Die DeepL-Integration ermöglicht das Übersetzen kompletter Transkripte.

Vorsicht: Diese Anbindungen ermöglichen zwar die bequeme weitere Auswertung der Texte – diese findet dann aber natürlich nicht mehr lokal statt.

Über APIs lassen sich Transkripte mit ChatGPT und Co. auswerten.

Benutzerfreundlichkeit

Ein weiterer Pluspunkt ist die flexible Nutzung: Ob als Menubar-App oder über eine Spotlight-ähnliche Schnellzugriffsfunktion – MacWhisper lässt sich nahtlos in den Arbeitsalltag integrieren.

Die Möglichkeit, Transkripte direkt in andere Apps einzufügen, spart dabei wertvolle Zeit.

Transkripte können einfach in verschiedene Formate exportiert werden.

Fazit

Mein Fazit: MacWhisper kostet zwar etwas, ist aber jeden Franken wert. Die Kombination aus lokaler Verarbeitung, ausgereifter Spracherkennung und der Möglichkeit zur KI-gestützten Weiterverarbeitung macht es zu einem unverzichtbaren Tool für alle, die regelmässig mit der Transkription vertraulicher Gespräche zu tun haben.

Der einmalige Kaufpreis ohne Abo-Modell und das Versprechen lebenslanger Updates machen die Investition besonders attraktiv. Für Journalisten, Studenten und Non-Profit-Organisationen gibt es sogar einen 30-prozentigen Rabatt – ein faires Angebot für eine aussergewöhnlich leistungsfähige Software.

Weitere Informationen: https://goodsnooze.gumroad.com/l/macwhisper

Dieser Beitrag erschien zum ersten Mal am 04.06.2025 auf dem Publishingblog: https://publishing.blog/macwhisper-lokale-transkription-von-sensiblen-daten/