Audioformate sind zur Zeit stark im Aufwind. Podcasts erleben seit einigen Monaten einen zweiten Frühling. Im Social Media-Teich wird gerade Clubhouse gehyped – eine App, die ausschliesslich auf spontane Gespräche und Diskussionen in hörbarer Form setzt. Und das gute alte Hörbuch ist in Corona-Zeiten für viele ein unverzichtbares Medium geworden.
Für uns hier beim Publishingblog gibt es aber noch einen weiteren Grund, warum wir Audio mögen. Audio erhöht die Accessibility und macht Inhalte auch Menschen zugänglich, die mit dem Lesen Mühe haben. Wir haben drum beschlossen, einzelne längere Beiträge als Audio zur Verfügung zu stellen.
Text2Speech
Weil wir hier beim Publishingblog sind, haben wir dafür natürlich eine möglichst automatisierte Lösung gesucht – und gefunden. In Form des WordPress-Plugins «Speaker», welches auf der Google Text2Speech-Technologie aufsetzt.
Dieses API von Google kann zu fairen Preisen genutzt werden und bietet im Jahr 2021 eine erstaunliche Qualität. Im Angebot sind mehr als 220 Stimmen in über 40 Sprachen. Auf Wunsch könnte man sogar seine eigene Stimme digitalisieren.
Audio erstellen
Das Audio ist schnell erstellt. Man installiert und aktiviert das Plugin und verbindet es mit dem Google-API. Dann steht einem im Editor von WordPress bei jedem Beitrag ein neues Setting zur Verfügung.
Ist der Beitrag publiziert, erstellt man einfach noch das Audio. Nimmt man weitere Änderungen am Artikel vor, kann man das Audio einfach nochmals erstellen.
Damit das Audio nicht aus Versehen die Menüs und sonstige Elemente der Benutzeroberfläche vorliest, kann man über einen einfachen Editor ein Audio-Template erstellen. In unserem Publishingblog-Template haben wir den Titel des Beitrags sowie den eigentlichen Content-DIV eingeschlossen. Alle anderen Elemente werden bei der Audio-Erstellung ignoriert.
Audio hören
Ist bei einem Beitrag ein Audio vorhanden, wird es den Lesern automatisch angezeigt. Die Position und die Gestaltung des Players ist dabei nach Wunsch wählbar.
Audio verbessern
Das generierte Audio hat schon out of the box eine sehr hohe Qualität. Um aber die Sprachsynthese noch besser zu machen, kann man als Autor im Text drin verschiedene Steuerungsbefehle einbauen.
Die Speech Synthesis Markup Language (SSML) bietet diverse Tags, um beispielsweise bei einzelnen Wörtern temporär die Sprache zu wechseln (englische Fachausdrücke in einem deutschen Text). Man kann aber auch die Tonlage der Stimme verändern, bestimmte Passagen mit speziell viel Energie sprechen oder auch bewusste Pause einbauen.
Speaker unterstützt diverse dieser Tags, die im Content-Editor ganz einfach in den Inhalt reingeschrieben werden.