Die Vodia PBX integriert nun Google Gemini mit JavaScript IVR und Voice Agents und ermöglicht so eine KI-gesteuerte Anrufbearbeitung und intelligente Weiterleitung in Echtzeit. Durch die Kombination der multimodalen großen Sprachmodelle von Gemini mit dem programmierbaren IVR-Framework von Vodia können Unternehmen Sprachagenten entwickeln, die Audio in Echtzeit streamen, Weiterleitungsentscheidungen über Funktionsaufrufe treffen und sowohl einfache als auch begleitete Weiterleitungen mit KI-gestützter Überprüfung durchführen. Diese Integration ermöglicht es Unternehmen, Anrufabläufe zu automatisieren, Wartezeiten zu reduzieren und die Produktivität zu verbessern, indem sie dialogorientierte KI nutzen, die direkt in der Telefonanlage funktioniert.
Vodia Networks freut sich, die Integration von Google Gemini („Gemini“) in die Vodia Javascript IVR-Funktionen bekannt zu geben. Gemini ermöglicht es Benutzern, direkt mit generativer KI zusammenzuarbeiten und direkten Zugriff auf aktuelle Google-KI-Modelle zu erhalten. Es handelt sich um eine Schnittstelle zu einem multimodalen Large Language Model (LLM), das Audio, Bilder und Text verarbeitet.
Gemini Personal Intelligence
Am 20. Januar 2026 führte Gemini Personal Intelligence ein – die Plattform kann nun mit den Google-Apps eines Nutzers verbunden werden, um personalisierte Gemini-Erlebnisse zu ermöglichen (Nutzer können über ihre Einstellungen für verbundene Apps auswählen, welche Apps verbunden werden sollen):
Personalisieren von Erlebnissen mit Einblicken in einzelne Nutzer und deren Vorlieben
Empfehlungen auf Grundlage der Nutzerpräferenzen aussprechen
Maßgeschneiderte Reiserouten erstellen
Entdecken und fassen Sie Informationen aus den Google-Apps eines Nutzers zusammen, z. B. wonach habe ich letzte Woche bei Google gesucht usw.
Auf Inhalte von Gmail und Google Fotos zugreifen
Vodias JavaScript IVR
Das JavaScript von Vodia bringt die volle Leistungsfähigkeit einer modernen Programmiersprache in die Telefonkommunikation und schafft damit unermessliche Flexibilität für maßgeschneiderte Anrufabläufe und die Integration mit externen Systemen. Unser einfaches IVR-Skript enthält die Kernfunktionen des IVR-Systems: Text-to-Speech-Ausgabe (TTS), Erfassung von DTMF-Eingaben (Tastentöne) und Kommunikation mit externen Anwendungen. Dieses Framework liefert dynamische Antworten auf Basis von Echtzeit-API-Aufrufen und ermöglicht so eine intelligente Anrufweiterleitung.
Die Integration des Vodia-Telefonsystems in Gemini bietet eine einwandfreie Anrufweiterleitungsfunktion für jedes Cloud-Kommunikationssystem.
Das Basic Voice Agents-Skript kann dank einer Integration mit den JavaScript Voice Agents-Funktionen von Vodia die Leistungsfähigkeit von Gemini nutzen. Diese Integration verwendet die bidirektionale Audio-Streaming-WebSocket-API von Gemini, um sowohl Echtzeit-Sprachkonversationen als auch intelligentes Call Routing zu verwalten:
Konfigurieren der Sitzung mit Modellparametern, Spracheinstellungen und Systemanweisungen
Definition von Funktionswerkzeuge, die Gemini für die Anrufweiterleitung (transfer_call) aufrufen kann
Herstellen einer WebSocket-Verbindung zum bidirektionalen Streaming-API-Endpunkt von Gemini
Managen von Fehlerzuständen und Zeitüberschreitungsszenarien mit Fallback-Übertragungen
Analysieren der Funktionsaufrufantworten von Gemini, um die geeignete Anrufweiterleitung zu bestimmen
Spielen Sie Audioantworten von Gemini für Anrufer ab
PCM-Audio vom Anrufer in Echtzeit an Gemini streamen
Nach der Integration in die Vodia-Telefonanlage fungiert Gemini als intelligenter Screening-Assistent für begleitete Weiterleitungen. Anstatt andere Benutzer manuell anzurufen, um deren Verfügbarkeit zu bestätigen, können Benutzer auf die KI-Sprachagenten des Systems zugreifen, um Anrufe automatisch zu überprüfen und weiterzuleiten.
Ein-Knopf-Screening
Die Integration der Vodia-Telefonanlage mit Gemini ermöglicht die begleitete Weiterleitung mit KI-Überprüfung über eine einzige Taste am Tischtelefon des Benutzers. Wie funktioniert das?
Der Anrufer möchte jemanden sprechen: "I need to speak with Bob"
Drücken der programmierten Taste: stellt den Anrufer automatisch in die Warteschleife und wählt die Sprachagenten
Frag die KI: "Finde Bob" oder "Ist Bob verfügbar?"
KI übernimmt die Vorauswahl: Ruft Bob an, fragt, ob er annehmen möchte, erhält Antwort
Automatisches Ergebnis: Anruf wird mit Bob verbunden oder Agent wird benachrichtigt, dass Bob beschäftigt ist
Fast alle VoIP-Tischtelefone unterstützen programmierbare Tasten, mit denen ein aktiver Anruf gehalten und die Durchwahl für die Voice Agents gewählt werden kann.
Vorteile
Die Vorteile der begleiteten Anrufweiterleitung von Gemini umfassen:
Ein-Knopf-Bedienung: alles mit einer einzigen Taste erledigen
Erhöhte Effizienz: kein manuelles Wählen und kein Warten auf die Antwort von Kollegen
Professionelle Überprüfung: KI liefert Kontext (Name des Anrufers)
Erhöhte Produktivität: Mitarbeiter können Anrufe ablehnen, wenn sie beschäftigt sind oder sich in Besprechungen befinden
Verkürzte Wartezeiten: schnellere Lösung für Anrufer
Universell: für alle, die über ein Tischtelefon verfügen, einschließlich Assistenten, Empfangsmitarbeiter, Teammitglieder usw.
Ausführliche Konfigurations- und Verwendungsanweisungen finden Sie in der Dokumentation „Voice Agents JS Example – Gemini Attended Transfer“.
Bei Vodia haben wir mehr als anderthalb Jahrzehnte damit verbracht, ein Cloud-Telefonsystem zu entwickeln, das die Geschäftskommunikation revolutioniert. Außerdem stellen wir regelmäßig sicher, dass wir mit der weltweit besten Business-Software von Drittanbietern kompatibel sind. Erfahren Sie mehr darüber, warum wir das Telefonsystem der Wahl für Unternehmen auf der ganzen Welt sind, mailen Sie uns an sales@vodia.com, oder rufen +1 (617) 861-3490 (US), +61 2 7201 0788 (APAC), oder +49 30 555 78749 (Europa) an.
*Google und Gemini sind Markenbezeichnungen der Google LLC
Videokonferenzen sind weit verbreitet, doch wird selten hinterfragt, wo sie stattfinden und wer die dahinterstehende Infrastruktur kontrolliert. In vielen Fällen wird der Videoverkehr von externen Systemen abgewickelt, was Abhängigkeiten mit sich bringt, die oft übersehen werden. Dieser Beitrag untersucht, wie die direkte Integration von Jitsi in die Telefonanlage (PBX) die Videokommunikation in dieselbe Umgebung wie die Sprach- und Kommunikationsverwaltung bringt. Dadurch erhalten Unternehmen klarere Abgrenzungen, sind weniger auf Plattformen von Drittanbietern angewiesen und haben mehr Kontrolle darüber, wie die Kommunikation abgewickelt wird.
Die Vodia-Telefonanlage lässt sich nun in efficy CRM integrieren, sodass Unternehmen ihre Telefonanlage direkt mit ihrer CRM-Plattform verbinden können. Bei eingehenden und ausgehenden Anrufen werden Kontakte automatisch erkannt, Anruferinformationen in Echtzeit angezeigt und ein direkter Zugriff auf die Kontaktdaten im CRM ermöglicht. Durch die Verknüpfung von Telefonie und Kundendaten hilft die Integration den Teams, effizienter zu reagieren, Interaktionen automatisch zu protokollieren und innerhalb ihrer bestehenden Arbeitsabläufe stets aktuelle Kundeninformationen zu pflegen.
Die Vodia-Telefonanlage lässt sich nun mit Jitsi Meet integrieren und bietet damit sichere, selbst gehostete Videokonferenzen direkt im Webportal. Nutzer können Meetings mit einem einzigen Klick starten, während integrierte Funktionen wie die JWT-basierte Authentifizierung, die automatische Erstellung von Konferenzräumen in Verbindung mit Nebenstellen sowie der kontrollierte Gastzugang für ein nahtloses und sicheres Erlebnis sorgen. Durch die Kombination von Sprach- und Videokommunikation in einem System erhalten Unternehmen und Dienstleister mehr Kontrolle über ihre Kommunikationsumgebung, verringern ihre Abhängigkeit von externen Plattformen und können effizienter skalieren.