Technik

Die Vodia- PBX vor Ort Bereitstellung von Whisper AI

Published on:

3.4.2025

Whisper, das automatische Spracherkennungssystem von OpenAI, liefert mehrsprachige, geräuschtolerante und fachsprachen taugliche Transkription durch eine optimierte Encoder-Decoder-Architektur. Mit der Integration der Vodia-PBX können Unternehmen wählen, ob sie den Service von OpenAI nutzen oder Whisper AI lokal hosten wollen, um die volle Datenhoheit und -kontrolle zu erhalten. Diese Vor-Ort-Option stellt sicher, dass die sensiblen Gesprächsdaten in Ihrer Infrastruktur verbleiben, während Sie dennoch von den leistungsstarken Transkriptionsfunktionen profitieren.

Whisper ist das automatische Spracherkennungssystem (ASR) von OpenAI. Das System wurde mit etwa 700.000 Stunden überwachter Daten aus dem Internet trainiert, die sowohl mehrsprachig als auch multitaskingfähig sind. Dank dieses Trainings, das mit vielfältigen und umfangreichen Datensätzen durchgeführt wurde, bewältigt Whisper Akzente, Hintergrundgeräusche und technische Sprache mit beeindruckender Leichtigkeit. Es führt auch Transkriptionen in zahlreichen Sprachen durch und übersetzt diese Sprachen ins amerikanische Englisch. 

Die Architektur von Whisper, die als Encoder-Decoder-Transformator implementiert ist, ist ein unkomplizierter Ende-zu-Ende Ansatz: Sie zerlegt die Audioeingabe in 30-Sekunden-Stücke, die in ein Log-Mel-Spektrogramm umgewandelt und durch einen Encoder geschickt werden; der Decoder ist darauf trainiert, die richtige Textbezeichnung zu antizipieren, kombiniert mit speziellen Token, die das einzelne Modell anweisen, die Sprachidentifikation, die mehrsprachige Sprachtranskription, Zeitstempel auf Phrasenebene und die Sprachübersetzung ins Englische vorzunehmen.

Im November letzten Jahres kündigten wir eine Beta-Version der Vodia- PBX an, die die PBX mit der Beta-Version der OpenAI Echtzeit-API verbindet. Wenn Ihr Unternehmen Wert auf Datensouveränität und Verarbeitung vor Ort legt, unterstützt Vodia auch die Bereitstellung von Whisper AI innerhalb Ihrer eigenen Infrastruktur. So behalten Sie die volle Kontrolle über Ihre Transkriptionsprozesse und können sicherstellen, dass sensible Anrufdaten sicher innerhalb Ihres Netzwerks bleiben.

Konfigurationsschritte

Gehen Sie folgendermaßen vor, um eine selbst gehostete Whisper AI-Instanz einzurichten:

  1. Wechseln Sie zum betreffenden Mandanten
    • Melden Sie sich bei Ihrem Vodia-Mandanten an.
    • Navigieren Sie zu Einstellungen => Allgemeines.
    • Scrollen Sie zu “Voreinstellung für Mitschneiden…”

  2. Geben Sie Bereitstellungs Details an
    • Geben Sie die URL Ihrer Whisper AI-Bereitstellung ein.
    • Tragen Sie den Benutzernamen und das Passwort ein.
Vodia - Call transcription Whisper AI On-Premise
  1. Speichern und Verbinden
    • Speichern Sie die Konfiguration, um eine sichere Verbindung zwischen Ihrer Vodia-Telefonanlage und Ihrer lokalen Whisper AI-Instanz herzustellen.

Zugriff auf Anruf Transkriptionen​

Um den transkribierten Inhalt anzuzeigen, melden Sie sich einfach bei Ihrem Benutzerportal an, navigieren Sie zum Abschnitt „Verlauf“, wählen Sie den gewünschten Anruf aus und überprüfen Sie dann den Bereich „Anruf Inhalt"

Vodia - Call Transcription History

Hardwareanforderungen

Um eine optimale Leistung beim Ausführen von Whisper AI auf Ihrer eigenen Hardware zu gewährleisten, beachten Sie die offiziellen Hardwareanforderungen, die imOpenAI Whisper GitHub-Repository aufgeführt sind.

Vorteile der Bereitstellung vor Ort

  • Datensouveränität: Behalten Sie vertrauliche Anrufdaten in Ihrem Netzwerk.
  • Volle Kontrolle: Verwalten und passen Sie Transkriptionsprozesse entsprechend den Anforderungen Ihres Unternehmens an.
  • Erhöhte Sicherheit: Stellen Sie die Einhaltung interner und behördlicher Sicherheitsstandards sicher.

Dank der Integration unserer Telefonanlage mit der Whisper-API ist es einfach, Anrufe zu transkribieren – Sie können OpenAI Whisper verwenden oder Ihren eigenen Whisper-Server hosten, um echten Datenschutz zu gewährleisten. Um mit der Transkription vor Ort zu beginnen, sehen Sie sich unsere Dokumentation zur Einrichtung von Whisper AI vor Ort an oder überprüfen Sie ein Beispiel für eine selbst gehostete Whisper-Integration. Wenn Sie an einem cloudbasierten Setup interessiert sind, folgen Sie unserem Leitfaden zur cloudbasierten Anruftranskription.

Da wir nun die Echtzeit-KI-API-Integration mit OpenAI unterstützen, erwägen wir auch die Integration mit weiteren KI-Anbietern, damit wir eine nahtlose KI-Integration in Arbeitsabläufe ermöglichen können. Wir würden Ihnen gerne alles darüber erzählen – kontaktieren Sie uns unter sales@vodia.com oder rufen Sie +1 (617) 861-3490 (USA), +61 2 7201 0788 (APAC) oder +49 30 555 78749 (Europa) an.

Neueste Artikel

Alles ansehen

Using service flags in V70 of the Vodia PBX

V70 of the Vodia PBX introduces flexible service flags that help organizations automate call routing, scheduling, queue management, announcements, and communication workflows throughout the day. Service flags can be configured manually or automatically to control how calls are handled during business hours, after hours, holidays, or special events. They can also be chained together for more advanced routing logic and integrated with external calendars such as Google Calendar to support dynamic scheduling and operational flexibility across business environments.

May 12, 2026

Vodia Analytics: Anrufanalyse und KI Einblicke in die Vodia PBX

Vodia Analytics wandelt PBX-Anrufdaten mithilfe von Echtzeit-Dashboards, detaillierten Anrufprotokollen und KI-gestützten Analysen in klare, umsetzbare Erkenntnisse um. Die Lösung bietet Teams einen umfassenden Einblick in Sprachinteraktionen und hilft ihnen dabei, Gespräche zu verstehen, die Leistung zu verfolgen und Probleme zu identifizieren, ohne auf Rohprotokolle oder manuelle Überprüfungen angewiesen zu sein. Dank integrierter Transkription, Zusammenfassungen und Stimmungsanalyse lassen sich Trends leichter erkennen, Abläufe optimieren und die Kommunikationsleistung insgesamt verbessern.

May 4, 2026

Jitsi-Videokonferenzen in V70: Ein kontrollierter Ansatz für den Datenschutz

Videokonferenzen sind weit verbreitet, doch wird selten hinterfragt, wo sie stattfinden und wer die dahinterstehende Infrastruktur kontrolliert. In vielen Fällen wird der Videoverkehr von externen Systemen abgewickelt, was Abhängigkeiten mit sich bringt, die oft übersehen werden. Dieser Beitrag untersucht, wie die direkte Integration von Jitsi in die Telefonanlage (PBX) die Videokommunikation in dieselbe Umgebung wie die Sprach- und Kommunikationsverwaltung bringt. Dadurch erhalten Unternehmen klarere Abgrenzungen, sind weniger auf Plattformen von Drittanbietern angewiesen und haben mehr Kontrolle darüber, wie die Kommunikation abgewickelt wird.

April 23, 2026