OpenAI hat begonnen, Advanced Voice Mode (AVM) für alle Plus und Team User in der ChatGPT App auszuliefern. Bis zum 02.10. soll die Einführung abgeschlossen sein. In der EU, Vereinigten Königreich, Schweiz, Island, Norwegen und Liechtenstein ist der Advanced Voice Mode jedoch noch nicht verfügbar und nur via VPN zu erreichen. Der erweiterte Sprachmodus macht die Ausgabestimme viel realistischer und die Sprachinteraktion wird intuitiver. Die Edu und Enterprise-Kunden erhalten ab kommender Woche Zugang.
Frisches Design und erweiterte Stimmauswahl
Sam Altman (OpenAI) hat gestern Abend auf der Plattform X den Hebel für die Veröffentlichung umgelegt.
advanced voice mode rollout starts today! (will be completed over the course of the week)
— Sam Altman (@sama) September 24, 2024
hope you think it was worth the wait 🥺🫶 https://t.co/rEWZzNFERQ
Im Rahmen der Einführung erhält der Advanced Voice Mode ein neues und modernes Erscheinungsbild. Anstelle der bisher verwendeten animierten schwarzen Punkte wird die AVM-Funktion nun durch eine blaue, animierte Kugel symbolisiert.
User werden über ein Pop-up in der ChatGPT-App neben dem Sprachsymbol benachrichtigt, sobald AVM für sie aktiviert ist.
Neu sind fünf zusätzliche Stimmen: Arbor, Maple, Sol, Spruce und Vale. Damit stehen ChatGPT-Nutzern insgesamt neun verschiedene Stimmen zur Auswahl, die alle von der Natur inspirierte Namen tragen. OpenAIs möchte die Interaktion mit ChatGPT möglichst realitätsnah gestalten.
“Sky”, die OpenAI Stimme, welche im Frühjahr präsentiert wurde, fehlt. Die Klangfarbe hatte eine große Ähnlichkeit mit der Voice von Schauspielerin Scarlett Johansson. Sie äußerte juristische Anfechtungen gegenüber OpenAI, da die Ähnlichkeit mit ihrer eigenen Stimme zu groß war. Zum Release wurde diese Stimmenoption entfernt.
Auch andere Unternehmen haben mittlerweile ähnliche Produkte präsentiert oder veröffentlicht, insbesondere Google mit Gemini Live. Mit Moshi gibt es zudem eine erste – wenn auch weniger leistungsstarke – Open-Source-Alternative
Optimierte Funktionalität und Mehrsprachigkeit
AVM hat seit der Alpha-Testphase erhebliche Optimierungen erfahren und laut OpenAI große Fortschritte gemacht. So soll ChatGPT jetzt besser verschiedene Akzente verstehen können, und die Dialoge sollen flüssiger und schneller ablaufen. Allerdings ist der fortgeschrittene Sprachmodus derzeit auf eine Stunde pro Tag begrenzt. Danach können Nutzer jedoch weiterhin mit der normalen Sprachausgabe von ChatGPT interagieren. Der fortgeschrittene Sprachmodus soll laut OpenAI in über 50 Sprachen verfügbar sein (teilweise nur über VPN). Der globale Einsatz und Nutzen des Tools für Menschen in vielen Ländern ist dadurch erweitert.
Daneben werden einige der Anpassungsfunktionen von ChatGPT auf den AVM ausgeweitet. Dazu gehören die Custom Instructions (ChatGPT individuell konfigurieren), mit denen ihr individualisieren könnt, wie ChatGPT auf euch reagiert. Durch die Memory-Funktion (Personalisierung/Erinnerung) kann sich ChatGPT an alte Gespräche erinnern und darauf Bezug nehmen.
ChatGPT Advanced Voice Mode nicht in Deutschland & vermisste Funktionen
Trotz der umfassenden Erweiterungen gibt es noch Einschränkungen. So ist der AVM in der EU, Großbritannien, der Schweiz und einigen anderen europäischen Ländern, aktuell nicht verfügbar.
Advanced Voice is not yet available in the EU, the UK, Switzerland, Iceland, Norway, and Liechtenstein.
— OpenAI (@OpenAI) September 24, 2024
VPN Trick: ChatGPT Advanced Voice Mode Deutschland & EU
Diese Einschränkung kann jedoch durch die Nutzung einer VPN-Verbindung über Bitdefender VPN umgangen werden. Wenn man den virtuellen Standort in der Software z. B. auf die USA einstellt, erhält man Zugang zum neuen Sprachfeature von OpenAI. Beim erneuten Öffnen der ChatGPT-App erscheint dann ein Pop-up, das über die Verfügbarkeit des erweiterten Sprachmodus informiert.
Ein möglicher Grund für die Nichtverfügbarkeit in der EU könnte das Erkennen von unseren Emotionen sein. Eine Funktion, die gemäß dem KI-Gesetz (EU AI Act) untersagt wäre.
(VPN für AVM in Deutschland – Anleitung)
Multimodale Features wie Video & Bild fehlen noch
Auch die im Frühjahr angekündigten Video- und Screen-Sharing-Funktionen sowie die Fähigkeit zur Echtzeitanalyse von Bildern und Grafiken sind in diesem Update nicht enthalten. Funktionen wie die Erkennung von Emotionen in Gesichtern oder das Generieren von Bildern wurden ebenfalls bisher nicht veröffentlicht. OpenAI hat bisher keinen Releasetermin für die Einführung dieser multimodalen Fähigkeiten genannt.
Derzeit kann der AVM auch nicht auf das Internet zugreifen und recherchieren.
Um potenzielle Missbrauchsmöglichkeiten einzudämmen, hat OpenAI zusätzliche Sicherheitsmaßnahmen integriert. Urheberrechtlich geschütztes Audiomaterial soll so vom System verhindert werden. Auch die Nachahmung und Imitation bekannter Personen soll beim Advanced Voice Mode erschwert sein.