Die Vodia PBX integriert nun Google Gemini mit JavaScript IVR und Voice Agents und ermöglicht so eine KI-gesteuerte Anrufbearbeitung und intelligente Weiterleitung in Echtzeit. Durch die Kombination der multimodalen großen Sprachmodelle von Gemini mit dem programmierbaren IVR-Framework von Vodia können Unternehmen Sprachagenten entwickeln, die Audio in Echtzeit streamen, Weiterleitungsentscheidungen über Funktionsaufrufe treffen und sowohl einfache als auch begleitete Weiterleitungen mit KI-gestützter Überprüfung durchführen. Diese Integration ermöglicht es Unternehmen, Anrufabläufe zu automatisieren, Wartezeiten zu reduzieren und die Produktivität zu verbessern, indem sie dialogorientierte KI nutzen, die direkt in der Telefonanlage funktioniert.
Vodia Networks freut sich, die Integration von Google Gemini („Gemini“) in die Vodia Javascript IVR-Funktionen bekannt zu geben. Gemini ermöglicht es Benutzern, direkt mit generativer KI zusammenzuarbeiten und direkten Zugriff auf aktuelle Google-KI-Modelle zu erhalten. Es handelt sich um eine Schnittstelle zu einem multimodalen Large Language Model (LLM), das Audio, Bilder und Text verarbeitet.
Gemini Personal Intelligence
Am 20. Januar 2026 führte Gemini Personal Intelligence ein – die Plattform kann nun mit den Google-Apps eines Nutzers verbunden werden, um personalisierte Gemini-Erlebnisse zu ermöglichen (Nutzer können über ihre Einstellungen für verbundene Apps auswählen, welche Apps verbunden werden sollen):
Personalisieren von Erlebnissen mit Einblicken in einzelne Nutzer und deren Vorlieben
Empfehlungen auf Grundlage der Nutzerpräferenzen aussprechen
Maßgeschneiderte Reiserouten erstellen
Entdecken und fassen Sie Informationen aus den Google-Apps eines Nutzers zusammen, z. B. wonach habe ich letzte Woche bei Google gesucht usw.
Auf Inhalte von Gmail und Google Fotos zugreifen
Vodias JavaScript IVR
Das JavaScript von Vodia bringt die volle Leistungsfähigkeit einer modernen Programmiersprache in die Telefonkommunikation und schafft damit unermessliche Flexibilität für maßgeschneiderte Anrufabläufe und die Integration mit externen Systemen. Unser einfaches IVR-Skript enthält die Kernfunktionen des IVR-Systems: Text-to-Speech-Ausgabe (TTS), Erfassung von DTMF-Eingaben (Tastentöne) und Kommunikation mit externen Anwendungen. Dieses Framework liefert dynamische Antworten auf Basis von Echtzeit-API-Aufrufen und ermöglicht so eine intelligente Anrufweiterleitung.
Die Integration des Vodia-Telefonsystems in Gemini bietet eine einwandfreie Anrufweiterleitungsfunktion für jedes Cloud-Kommunikationssystem.
Das Basic Voice Agents-Skript kann dank einer Integration mit den JavaScript Voice Agents-Funktionen von Vodia die Leistungsfähigkeit von Gemini nutzen. Diese Integration verwendet die bidirektionale Audio-Streaming-WebSocket-API von Gemini, um sowohl Echtzeit-Sprachkonversationen als auch intelligentes Call Routing zu verwalten:
Konfigurieren der Sitzung mit Modellparametern, Spracheinstellungen und Systemanweisungen
Definition von Funktionswerkzeuge, die Gemini für die Anrufweiterleitung (transfer_call) aufrufen kann
Herstellen einer WebSocket-Verbindung zum bidirektionalen Streaming-API-Endpunkt von Gemini
Managen von Fehlerzuständen und Zeitüberschreitungsszenarien mit Fallback-Übertragungen
Analysieren der Funktionsaufrufantworten von Gemini, um die geeignete Anrufweiterleitung zu bestimmen
Spielen Sie Audioantworten von Gemini für Anrufer ab
PCM-Audio vom Anrufer in Echtzeit an Gemini streamen
Nach der Integration in die Vodia-Telefonanlage fungiert Gemini als intelligenter Screening-Assistent für begleitete Weiterleitungen. Anstatt andere Benutzer manuell anzurufen, um deren Verfügbarkeit zu bestätigen, können Benutzer auf die KI-Sprachagenten des Systems zugreifen, um Anrufe automatisch zu überprüfen und weiterzuleiten.
Ein-Knopf-Screening
Die Integration der Vodia-Telefonanlage mit Gemini ermöglicht die begleitete Weiterleitung mit KI-Überprüfung über eine einzige Taste am Tischtelefon des Benutzers. Wie funktioniert das?
Der Anrufer möchte jemanden sprechen: "I need to speak with Bob"
Drücken der programmierten Taste: stellt den Anrufer automatisch in die Warteschleife und wählt die Sprachagenten
Frag die KI: "Finde Bob" oder "Ist Bob verfügbar?"
KI übernimmt die Vorauswahl: Ruft Bob an, fragt, ob er annehmen möchte, erhält Antwort
Automatisches Ergebnis: Anruf wird mit Bob verbunden oder Agent wird benachrichtigt, dass Bob beschäftigt ist
Fast alle VoIP-Tischtelefone unterstützen programmierbare Tasten, mit denen ein aktiver Anruf gehalten und die Durchwahl für die Voice Agents gewählt werden kann.
Vorteile
Die Vorteile der begleiteten Anrufweiterleitung von Gemini umfassen:
Ein-Knopf-Bedienung: alles mit einer einzigen Taste erledigen
Erhöhte Effizienz: kein manuelles Wählen und kein Warten auf die Antwort von Kollegen
Professionelle Überprüfung: KI liefert Kontext (Name des Anrufers)
Erhöhte Produktivität: Mitarbeiter können Anrufe ablehnen, wenn sie beschäftigt sind oder sich in Besprechungen befinden
Verkürzte Wartezeiten: schnellere Lösung für Anrufer
Universell: für alle, die über ein Tischtelefon verfügen, einschließlich Assistenten, Empfangsmitarbeiter, Teammitglieder usw.
Ausführliche Konfigurations- und Verwendungsanweisungen finden Sie in der Dokumentation „Voice Agents JS Example – Gemini Attended Transfer“.
Bei Vodia haben wir mehr als anderthalb Jahrzehnte damit verbracht, ein Cloud-Telefonsystem zu entwickeln, das die Geschäftskommunikation revolutioniert. Außerdem stellen wir regelmäßig sicher, dass wir mit der weltweit besten Business-Software von Drittanbietern kompatibel sind. Erfahren Sie mehr darüber, warum wir das Telefonsystem der Wahl für Unternehmen auf der ganzen Welt sind, mailen Sie uns an sales@vodia.com, oder rufen +1 (617) 861-3490 (US), +61 2 7201 0788 (APAC), oder +49 30 555 78749 (Europa) an.
*Google und Gemini sind Markenbezeichnungen der Google LLC
Im Jahr 2026 muss ein modernes Telefonsystem weit über einfache Anruffunktionen hinausgehen. Zu den Kernanforderungen gehören nun integrierte KI für eine intelligentere Anrufbearbeitung und Transkription, Echtzeit-Analyse-Dashboards für Transparenz und Kontrolle, flexible automatische Vermittlungsstellen für eine effiziente Anrufweiterleitung, nahtlose Microsoft Teams-Integration und robuste mobile Apps, die hybrides und Remote-Arbeiten unterstützen. Eine klare Trennung zwischen geschäftlichen und privaten Anrufen schützt die Work-Life-Balance, während erstklassiger Support dafür sorgt, dass diese Funktionen in realen Umgebungen reibungslos funktionieren, wenn sich die Anforderungen weiterentwickeln.
Ältere Telefonsysteme funktionieren zwar möglicherweise noch, sind jedoch oft mit versteckten Kosten, eingeschränkter Skalierbarkeit und geringer Unterstützung für hybrides Arbeiten verbunden. Veraltete Hardware, laufende Wartungskosten und eine starre Infrastruktur können das Wachstum von Unternehmen unbemerkt behindern. Cloud-basierte VoIP-Systeme beseitigen diese Einschränkungen, indem sie die Telefoniekosten senken, die Flexibilität verbessern und Teams eine nahtlose Kommunikation von überall aus ermöglichen. Für viele Unternehmen ist die Modernisierung der Geschäftstelefonie nicht mehr optional, sondern ein praktischer Schritt in Richtung Effizienz und Ausfallsicherheit.
Eine optimierte Integration verbindet die Vodia-Telefonanlage mit der ElevenLabs Voice AI-Plattform mithilfe eines schlanken IVR-JavaScript-Skripts und nativem SIP REFER für die Anrufweiterleitung. Die Audio- und Anrufsteuerung erfolgt vollständig über Standard-SIP-Signalisierung, während die gesamte Gesprächslogik, die Eingabeaufforderungen, die Sprachauswahl und die Weiterleitungsregeln im ElevenLabs-Dashboard konfiguriert werden. Durch diesen Ansatz sind keine Webhooks oder WebSocket-Verbindungen erforderlich und die PBX-Seite bleibt bewusst minimalistisch, sodass die Bereitstellung übersichtlich und produktionsreif ist.