Die Vodia PBX bietet jetzt Echtzeit-Transkription von Anrufen durch eine nahtlose Integration mit Whisper AI, dem fortschrittlichen Spracherkennungssystem von OpenAI. Mit Unterstützung für mehrere Sprachen, Fachvokabular und für laute Umgebungen ausgelegt, liefert Whisper selbst in komplexen Anrufszenarien genaue Transkriptionen. Administratoren können die Transkription pro Tenant mit einem OpenAI-API-Schlüssel aktivieren, was die Einrichtung einfach und flexibel macht. Sobald die Funktion aktiviert ist, werden alle Anrufe automatisch transkribiert und sind im Benutzerportal zur einfachen Überprüfung und Dokumentation zugänglich.
Vodia freut sich, eine weitere Verbesserung unseres Telefonsystems ankündigen zu können - die Anruf-Transkription mit Whisper AI. Diese nahtlose Integration ermöglicht es Vodia-Kunden, die Sprach-zu-Text-Funktion von Whisper AI in ihrem Kommunikations-Ökosystem einzusetzen und für einzelne Mandanten zu konfigurieren.
Whisper, entwickelt von OpenAI, ist ein automatisches Spracherkennungssystem (ASR). Whisper wurde auf der Grundlage von fast einer dreiviertel Million Stunden überwachter mehrsprachiger und multitaskingfähiger Daten aus dem Internet trainiert und kann dank dieses vielfältigen, umfangreichen Datensatzes geschickt mit Fachsprache, Hintergrundgeräuschen und Akzenten umgehen. Es transkribiert in einer Vielzahl von Sprachen und übersetzt sie alle ins Englische.
Die Whisper-Architektur, ein Kodierer-Dekodierer-Transformator, ist ein einfacher vorne-bis-hinten Ansatz: Er trennt Audio in 30-Sekunden-Segmente, die dann in ein Log-Mel-Spektrum umgewandelt und durch einen Kodierer geliefert werden; der Dekodierer nimmt die korrekte Textbeschriftung vorweg, kombiniert mit spezifischen Tokens, die das einzelne Modell steuern, um zahlreiche Aufgaben zu erfüllen, einschließlich mehrsprachiger Sprachtranskription, Sprachübersetzung ins Englische und Zeitstempel auf Phrasenebene.
Vodia kündigte im November 2024 eine Beta-Version unserer PBX an, die eine Telefonanlage mit der OpenAI-Echtzeit-API (Beta-Version) verbindet. Wir freuen uns, dass wir unseren Kunden nun einen Cloud-Weg anbieten können, um die Leistung von Whisper AI zu nutzen.
Wie richtet man die OpenAI Cloud Transkription ein
Um die Cloud-Transkription von OpenAI zu nutzen, sind ein OpenAI-Konto und ein API-Schlüssel erforderlich.
OpenAI Account: Navigieren Sie zur OpenAI-Plattform und erstellen Sie ein Konto oder melden Sie sich über Google, Microsoft oder E-Mail an.
API-Schlüssel abrufen: Rufen Sie die Seite API-Schlüssel auf, erzeugen Sie einen neuen geheimen Schlüssel und kopieren Sie ihn sicher. Dieser Schlüssel wird nur einmal angezeigt.
Vodia Integration: Aktivieren Sie in den allgemeinen Einstellungen des Tenants die Transkription und geben Sie den OpenAI-API-Schlüssel ein.
Nach Abschluss werden alle Anrufe transkribiert und sind im Benutzerportal verfügbar.
Zugriff auf Anrufabschriften
Um den transkribierten Inhalt anzuzeigen, melden Sie sich einfach bei Ihrem Benutzerportal an, klicken Sie auf Listen, wählen Sie den gewünschten Anruf aus und sehen Sie sich den Bereich Anrufinhalt an.
Wenn Sie daran interessiert sind, wie man Whisper on-premise installiert, lesen Sie unseren blog post mit step-by-step Anleitung.
Wir freuen uns darauf, über Whisper zu sprechen. Kontaktieren Sie unser Vertriebsteam unter sales@vodia.com oder rufen Sie uns an unter +49 (30) 55578749.
Eine optimierte Integration verbindet die Vodia-Telefonanlage mit der ElevenLabs Voice AI-Plattform mithilfe eines schlanken IVR-JavaScript-Skripts und nativem SIP REFER für die Anrufweiterleitung. Die Audio- und Anrufsteuerung erfolgt vollständig über Standard-SIP-Signalisierung, während die gesamte Gesprächslogik, die Eingabeaufforderungen, die Sprachauswahl und die Weiterleitungsregeln im ElevenLabs-Dashboard konfiguriert werden. Durch diesen Ansatz sind keine Webhooks oder WebSocket-Verbindungen erforderlich und die PBX-Seite bleibt bewusst minimalistisch, sodass die Bereitstellung übersichtlich und produktionsreif ist.
Dank der Multi-Tenant-Architektur können MSPs mehrere Kunden effizient über eine einzige, sichere Telefonanlage verwalten und dabei eine strikte Trennung der Mandanten gewährleisten. Durch die gemeinsame Nutzung der Infrastruktur können MSPs ihre Betriebskosten senken, Updates und Sicherheitspatches zentral installieren, Kunden nach Bedarf skalieren und schneller einbinden, ohne die Komplexität zu erhöhen. Da Cloud- und SaaS-Modelle weiterhin dominieren, bietet ein gut konzipiertes Multi-Tenant-Telefonsystem die Kontrolle, Flexibilität und Zuverlässigkeit, die MSPs benötigen, um Wachstum, sich wandelnde Anforderungen und moderne Kommunikationsaufgaben zu bewältigen.
Vodia ist eine flexible, cloudneutrale Telefonanlage, die für den Einsatz in der Praxis im Jahr 2026 entwickelt wurde. Sie unterstützt MSPs, Unternehmen und Dienstleister mit einer offenen, SIP-kompatiblen Plattform, die auf Skalierbarkeit ausgelegt ist. Mit der Einführung von Vodia PBX Version 70 im ersten Quartal 2026 bietet die Plattform Multi-Tenant-Hosting, die Wiederverwendung bestehender IP-Telefone durch zentralisierte Bereitstellung, integrierte WebRTC-Softphones, transparente Lizenzierung und partnerorientierten Support, sodass Unternehmen die volle Kontrolle über moderne Geschäftstelefonie haben, ohne an einen Anbieter gebunden zu sein oder versteckte Kosten zu haben.