Technik

Die Vodia-PBX Cloud Whisper AI-Bereitstellung

Published on:

9.4.2025

Die Vodia PBX bietet jetzt Echtzeit-Transkription von Anrufen durch eine nahtlose Integration mit Whisper AI, dem fortschrittlichen Spracherkennungssystem von OpenAI. Mit Unterstützung für mehrere Sprachen, Fachvokabular und für laute Umgebungen ausgelegt, liefert Whisper selbst in komplexen Anrufszenarien genaue Transkriptionen. Administratoren können die Transkription pro Tenant mit einem OpenAI-API-Schlüssel aktivieren, was die Einrichtung einfach und flexibel macht. Sobald die Funktion aktiviert ist, werden alle Anrufe automatisch transkribiert und sind im Benutzerportal zur einfachen Überprüfung und Dokumentation zugänglich.

Vodia freut sich, eine weitere Verbesserung unseres Telefonsystems ankündigen zu können - die Anruf-Transkription mit Whisper AI. Diese nahtlose Integration ermöglicht es Vodia-Kunden, die Sprach-zu-Text-Funktion von Whisper AI in ihrem Kommunikations-Ökosystem einzusetzen und für einzelne Mandanten zu konfigurieren.

Whisper, entwickelt von OpenAI, ist ein automatisches Spracherkennungssystem (ASR). Whisper wurde auf der Grundlage von fast einer dreiviertel Million Stunden überwachter mehrsprachiger und multitaskingfähiger Daten aus dem Internet trainiert und kann dank dieses vielfältigen, umfangreichen Datensatzes geschickt mit Fachsprache, Hintergrundgeräuschen und Akzenten umgehen. Es transkribiert in einer Vielzahl von Sprachen und übersetzt sie alle ins Englische. 

Die Whisper-Architektur, ein Kodierer-Dekodierer-Transformator, ist ein einfacher vorne-bis-hinten Ansatz: Er trennt Audio in 30-Sekunden-Segmente, die dann in ein Log-Mel-Spektrum umgewandelt und durch einen Kodierer geliefert werden; der Dekodierer nimmt die korrekte Textbeschriftung vorweg, kombiniert mit spezifischen Tokens, die das einzelne Modell steuern, um zahlreiche Aufgaben zu erfüllen, einschließlich mehrsprachiger Sprachtranskription, Sprachübersetzung ins Englische und Zeitstempel auf Phrasenebene.  

Vodia kündigte im November 2024 eine Beta-Version unserer PBX an, die eine Telefonanlage mit der OpenAI-Echtzeit-API (Beta-Version) verbindet. Wir freuen uns, dass wir unseren Kunden nun einen Cloud-Weg anbieten können, um die Leistung von Whisper AI zu nutzen. 

Wie richtet man die OpenAI Cloud Transkription ein

Um die Cloud-Transkription von OpenAI zu nutzen, sind ein OpenAI-Konto und ein API-Schlüssel erforderlich.

  • OpenAI Account: Navigieren Sie zur OpenAI-Plattform und erstellen Sie ein Konto oder melden Sie sich über Google, Microsoft oder E-Mail an.
  • API-Schlüssel abrufen: Rufen Sie die Seite API-Schlüssel auf, erzeugen Sie einen neuen geheimen Schlüssel und kopieren Sie ihn sicher. Dieser Schlüssel wird nur einmal angezeigt.
  • Vodia Integration: Aktivieren Sie in den allgemeinen Einstellungen des Tenants die Transkription und geben Sie den OpenAI-API-Schlüssel ein.
Recording defaults for Whisper AI Screenshot

Nach Abschluss werden alle Anrufe transkribiert und sind im Benutzerportal verfügbar.

Zugriff auf Anrufabschriften

Um den transkribierten Inhalt anzuzeigen, melden Sie sich einfach bei Ihrem Benutzerportal an, klicken Sie auf Listen, wählen Sie den gewünschten Anruf aus und sehen Sie sich den Bereich Anrufinhalt an.

Weitere Einzelheiten finden Sie in unserer Vodia PBX Cloud Whisper deployment Dokumentation

Wenn Sie daran interessiert sind, wie man Whisper on-premise installiert, lesen Sie unseren blog post mit step-by-step Anleitung.

Wir freuen uns darauf, über Whisper zu sprechen. Kontaktieren Sie unser Vertriebsteam unter sales@vodia.com oder rufen Sie uns an unter +49 (30) 55578749.

Neueste Artikel

Alles ansehen

Die Vodia-PBX und Google Gemini

Die Vodia PBX integriert nun Google Gemini mit JavaScript IVR und Voice Agents und ermöglicht so eine KI-gesteuerte Anrufbearbeitung und intelligente Weiterleitung in Echtzeit. Durch die Kombination der multimodalen großen Sprachmodelle von Gemini mit dem programmierbaren IVR-Framework von Vodia können Unternehmen Sprachagenten entwickeln, die Audio in Echtzeit streamen, Weiterleitungsentscheidungen über Funktionsaufrufe treffen und sowohl einfache als auch begleitete Weiterleitungen mit KI-gestützter Überprüfung durchführen. Diese Integration ermöglicht es Unternehmen, Anrufabläufe zu automatisieren, Wartezeiten zu reduzieren und die Produktivität zu verbessern, indem sie dialogorientierte KI nutzen, die direkt in der Telefonanlage funktioniert.

February 4, 2026

6 + 1 Telefoniefunktionen, die Sie 2026 benötigen

Im Jahr 2026 muss ein modernes Telefonsystem weit über einfache Anruffunktionen hinausgehen. Zu den Kernanforderungen gehören nun integrierte KI für eine intelligentere Anrufbearbeitung und Transkription, Echtzeit-Analyse-Dashboards für Transparenz und Kontrolle, flexible automatische Vermittlungsstellen für eine effiziente Anrufweiterleitung, nahtlose Microsoft Teams-Integration und robuste mobile Apps, die hybrides und Remote-Arbeiten unterstützen. Eine klare Trennung zwischen geschäftlichen und privaten Anrufen schützt die Work-Life-Balance, während erstklassiger Support dafür sorgt, dass diese Funktionen in realen Umgebungen reibungslos funktionieren, wenn sich die Anforderungen weiterentwickeln.

January 30, 2026

Ihr veraltetes Telefonsystem kostet Ihr Unternehmen Geld

Ältere Telefonsysteme funktionieren zwar möglicherweise noch, sind jedoch oft mit versteckten Kosten, eingeschränkter Skalierbarkeit und geringer Unterstützung für hybrides Arbeiten verbunden. Veraltete Hardware, laufende Wartungskosten und eine starre Infrastruktur können das Wachstum von Unternehmen unbemerkt behindern. Cloud-basierte VoIP-Systeme beseitigen diese Einschränkungen, indem sie die Telefoniekosten senken, die Flexibilität verbessern und Teams eine nahtlose Kommunikation von überall aus ermöglichen. Für viele Unternehmen ist die Modernisierung der Geschäftstelefonie nicht mehr optional, sondern ein praktischer Schritt in Richtung Effizienz und Ausfallsicherheit.

January 29, 2026