Dostawca chatbota jako dostawca voicebota? 5 powodów, że to może nie być najlepszy pomysł
Głos jest podstawowym środkiem komunikacji międzyludzkiej – uczymy się korzystać z niego już w dzieciństwie. Pomimo dostępności kanałów tekstowych, takich jak SMS-y i WhatsApp, to właśnie rozmowa pozostaje najważniejszym sposobem wymiany informacji. Znajduje to odzwierciedlenie w branży konwersacyjnej AI – coraz więcej firm, w tym dostawcy chatbotów, inwestuje w boty głosowe.
Pozostaje jednak pytanie, w jaki sposób tworzenie voicebotów bezpośrednio w oparciu o chatboty wpływa na jakość interakcji człowiek–bot oraz jakie konsekwencje ma takie rozwiązanie.
W artykule odpowiadamy na to pytanie, wskazując 5 istotnych powodów, dla których wybór dostawcy chatbota jako dostawcy voicebota może nie być najlepszym pomysłem.
W tym artykule:
- Punkt wyjścia: dostawcy chatbotów wchodzą na rynek voicebotów
- Dlaczego warto wybrać voicebota zamiast chatbota?
- Jak zmienić chatbota w voicebota?
- Dlaczego voicebot oparty bezpośrednio na chatbocie nie jest idealnym rozwiązaniem?
- Voiceboty oparte o ChatGPT – zalety i wady
- Podsumowanie: dostawcy chatbotów vs. dostawcy voicebotów
Punkt wyjścia: dostawcy chatbotów wchodzą na rynek voicebotów
Telefon jest nadal naszym sprzymierzeńcem, jeśli chodzi o kontakt z obsługą klienta – to skuteczny kanał komunikacji, pozwalający na szybkie rozwiązanie problemów. Jest tu jednak pewien haczyk: gdy dzwonimy na infolinię, istnieje duże prawdopodobieństwo, że będziemy długo czekać w kolejce – szczególnie w szczycie sezonu.
Może to prowadzić do frustracji, co tylko pogarsza samopoczucie dzwoniącego i jego stosunek do firmy. Aby tego uniknąć, można zautomatyzować połączenia przychodzące i wychodzące dzięki voicebotowi, który odbiera natychmiast i jest dostępny 24/7/365.
Nie jest tajemnicą, że jeśli chodzi o komunikację biznesową, to chatboty utorowały drogę voicebotom. Same chatboty są na rynku nieco dłużej i zdążyły już zdobyć zaufanie klientów, którzy chcą mieć dostęp do usług 24/7, a tym samym uzyskać szybkie odpowiedzi. Prosta integracja chatbota z dowolnym urządzeniem wykorzystującym czat jako środek komunikacji – smartfonem, laptopem, tabletem, itp. – była wielką zaletą zarówno dla użytkowników, jak i firm.
Jednak dziś to voiceboty zyskują popularność w dziedzinie konwersacyjnej AI, a kluczowi gracze z branży chatbotów wkraczają na to pole.
Dlaczego warto wybrać voicebota zamiast chatbota?
Wyjaśnijmy jednak, co jest głównym powodem, dla którego dostawcy chatbotów chcą budować voiceboty na bazie swoich rozwiązań.
Oto kilka przewag botów głosowych:
- Telefon jako kluczowy kanał komunikacji: Większość klientów kontaktuje się z firmami telefonicznie, a według badań Salesforce około 59% klientów do kontaktu z konsultantami call center używa telefonu.
- Szybsza interakcja: Tym, co odróżnia rozmowy od wiadomości tekstowych, jest synchroniczna komunikacja, która pozwala rozwiązywać pilne sprawy w okamgnieniu. Mówienie jest również bardziej intuicyjne, szybsze i bardziej przyjazne dla użytkownika niż niż pisanie wiadomości tekstowych.
- Wolne ręce: Niektóre osoby chcą komunikować się z firmą, nie używając rąk, gdyż jednocześnie wykonują inne zadania (powodem może być także niepełnosprawność). Włączając voicebota do procesu komunikacji, firmy mogą zaspokoić potrzeby tych odbiorców oraz być bardziej inkluzywne.
- Bardziej naturalna komunikacja: Możliwość usłyszenia głosu po drugiej stronie słuchawki sprawia, że interakcja ma bardziej „ludzki” charakter, w odróżnieniu od tekstowej konwersacji z chatbotem.
Zapotrzebowanie na takie rozwiązania rośnie, a oczekuje się, że rynek voicebotów w będzie rósł w tempie 21,30% w latach 2022–2027 – dotyczy to obsługi klienta, która jest najbardziej pożądanym obszarem dla narzędzi konwersacyjnej AI.
Jak zmienić chatbota w voicebota?
Ale w jaki sposób dostawcy chatbotów zmieniają swój modus operandi? Nie znając dobrze tematu, można by przypuszczać, że nie ma zbyt wielu różnic między chatbotami a voicebotami, ale w rzeczywistości jest tu dużo więcej czynników i wyzwań, które należy wziąć pod uwagę.
Firmy, które ostatnie lata poświęciły tworzeniu rozwiązań komunikacyjnych opartych na tekście, tworzą dziś asystentów głosowych, zamieniając tekst w mowę za pomocą modeli AI, takich jak ChatGPT. Metoda ta jest jednak dyskusyjna, co wyjaśnimy w dalszej części artykułu.
Dlaczego voicebot oparty bezpośrednio na chatbocie nie jest idealnym rozwiązaniem?
Przejdźmy jednak do sedna sprawy – jakie wyzwania wiążą się z tworzeniem bota głosowego bezpośrednio w oparciu o chatbota i dlaczego warto ponownie rozważyć ten pomysł? Czytaj dalej!
Powód #1: Czas reakcji
Pisanie z chatbotem tekstowym jest typową komunikacją asynchroniczną – nie oczekujemy, że maszyna udzieli nam odpowiedzi natychmiast i jesteśmy skłonni poczekać na nią przez krótszą lub dłuższą chwilę. Zupełnie inaczej jest w przypadku voicebota – tutaj jakakolwiek zauważalna pauza w udzielaniu odpowiedzi sprawia, że rozmówca może poczuć się niepewny albo zniecierpliwiony. W przeciwieństwie do rozmowy z chatbotem, gdzie użytkownicy mogą szybko skanować i przewijać tekst, interakcja z voicebotem wymaga udzielania zwięzłych odpowiedzi ze względu na naturalne tempo komunikacji głosowej.
Szacuje się, że voicebot, który zaczyna udzielać odpowiedzi w czasie krótszym niż 0,7 sekundy po wybrzmieniu pytania, brzmi jak człowiek; jeśli jest to od 1 do 1,5 sekundy – jak kompetentna maszyna, a powyżej 2 sekund – jak gorszej jakości bot.
Przy projektowaniu voicebotów kluczowe jest zapewnienie jasnych i zwięzłych odpowiedzi, ponieważ ludzie przetwarzają mowę inaczej niż tekst pisany. Różnica ta pokazuje, jak ważna jest rola projektantów konwersacji, którzy rozumieją niuanse ludzkiej mowy i wzorce słuchania.
Jeśli bezpośrednio wykorzystamy oprogramowanie chatbota, by stworzyć voicebota, problem związany z dłuższym czasem reakcji wciąż pozostanie. Przyczyną jest fakt, że technologia chatbotów nie została zaprojektowana dla komunikacji synchronicznej. Dlatego też połączenie chatbota z technologią głosową przełoży się na dość nienaturalne interakcje.
Powód #2: Warstwa parawerbalna
Rozmowa głosowa znacznie różni się od tekstowej nie tylko pod względem czasu reakcji, ale także pod kątem komunikacji niewerbalnej. Chatbot oferuje tylko i wyłącznie tekst, w najlepszym razie okraszony ikonkami.
Z kolei voicebot prócz tekstu ma do dyspozycji całą gamę środków wyrazu, z których nie tylko może, ale wręcz powinien korzystać, by komunikacja była pełna i naturalna – takich jak odpowiednia intonacja (by mowa nie brzmiała „mechanicznie”), pauzy we właściwych momentach, tempo mówienia czy ton głosu wyrażający emocje (np. mówiąc o czymś poważnym, voicebot powinien używać innego tonu, niż ogłaszając radosną nowinę).
Nowoczesne voiceboty dysponują bardzo naturalnymi głosami, które dodatkowo mogą uwzględniać nawet takie środki wyrazu, jak oddechy czy potakujące chrząknięcia. Nie wspominając już o tym, że władający różnymi językami voicebot musi także dostosować się do lokalnych akcentów!
Chcesz wiedzieć, jak brzmi nasz voicebot?
Kliknij, by posłuchać krótkich rozmów!
Działa to także w drugą stronę – również voicebot musi zrozumieć człowieka, który nie tylko pisze, ale i mówi, często niewyraźnie, cicho lub z nietypowym akcentem. (Przy tej okazji warto także wspomnieć, że istnieje już technologia, która pozwala voicebotom rozpoznawać emocje ludzi, chociaż z wielu względów – między innymi ze względów etycznych – nie jest szeroko wykorzystywana).
Jaki z tego wniosek? Otóż, żeby stworzyć naprawdę dobrego voicebota, należy go wyposażyć we właściwie działające pozawerbalne środki wyrazu, co jest bardzo wymagającym i złożonym zadaniem, którym zwykle zajmują się projektanci voicebotów.
Aby się przekonać, sprawdź, jak voicebot rozmawia z rozzłoszczonym klientem, obsługując jednocześnie wiele intencji:
Reason #3: Złożoność scenariusza
Chatbot – podobnie jak voicebot – działa na bazie scenariusza, czyli ramowego planu rozmowy, uwzględniającego wszystkie prawdopodobne pytania i odpowiedzi, a także wiele różnych rozgałęzień tej ścieżki.
Tu uwidacznia się zasadnicza przewaga voicebota, który od początku był zaprojektowany jako właśnie voicebot: ponieważ rozmowa głosowa jest bardziej dynamiczna, jego scenariusz jest zwykle dużo bardziej złożony, mniej linearny oraz bierze pod uwagę więcej potencjalnych sytuacji awaryjnych.
W trybie pisania ludzie wyrażają się inaczej, niż używając głosu. Oznacza to, że nawet bezbłędny scenariusz chatbota, stworzony z wykorzystaniem LLM, będzie nienaturalny, jeśli zostanie bez żadnych modyfikacji przekonwertowany na głos. Voicebot zbudowany bezpośrednio na podstawie scenariusza chatbota będzie zatem ograniczony i nie będzie w stanie skutecznie rozwiązać wielu problemów klientów.
Podobnie jak w poprzednim przypadku, stworzenie dobrego scenariusza dla voicebota jest zasobochłonne – wymaga wielu godzin pracy doświadczonych projektantów konwersacji.
Powód #4: Kontrola nad rozmową
Rozmawiając z chatbotem, człowiek zadaje mu pytanie, a chatbot zaczyna generować odpowiedź, którą po chwili w całości prezentuje. W przypadku voicebota logika jest nieco inna: maszyna zaczyna mówić niemal od razu, ale rozmówca – jeśli uzna, że nie o to mu chodziło – może mu przerwać, nie czekając na zakończenie wypowiedzi.
I voicebot zareaguje: przerwie wypowiedź i wysłucha klienta. Dzięki temu ten ostatni ma większą kontrolę nad przebiegiem konwersacji i może szybciej załatwić swoją sprawę. Dostawca chatbota, tworząc voicebota bezpośrednio na bazie swojego rozwiązania, musi dodatkowo nauczyć go słuchać słów klienta przez cały czas trwania rozmowy i natychmiast na nie reagować.
Powód #5: Doświadczenie telekomunikacyjne
Ostatnim dobrym powodem, dla którego nie warto wybierać dostawcy chatbota jako dostawcy voicebota, nie dotyczy samego oprogramowania, lecz doświadczenia na rynku telekomunikacyjnym.
Voicebot działa w ścisłej współpracy z dostawcami usług telefonicznych i na nich bazuje. Dlatego firma, która tak jak Apifonica od początku specjalizuje się w voicebotach, ma pewną przewagę – może zapewnić klientom najlepsze stawki oraz doświadczenie technologiczne i biznesowe we współpracy z telekomami.
Voiceboty oparte o ChatGPT – za i przeciw
ChatGPT to jeden z najbardziej znanych chatbotów – wydaje się znać odpowiedź na każdy problem, z jakim zwróci się do niego użytkownik. Działa w oparciu o tak zwane duże modele językowe (LLM), czyli algorytmy bazujące na przetwarzaniu języka naturalnego (NLP). Model jest uczony na podstawie ogromnych zbiorów danych tekstowych – i na tej bazie dopasowuje odpowiedzi do zapytań. ChatGPT może być także wykorzystany przez dostawcę chatbota do stworzenia voicebota – w tym przypadku za pomocą technologii speech-to-text i text-to-speech dane tekstowe przekształcane są na głos.
Tak stworzony voicebot może prowadzić z użytkownikiem bardzo swobodną rozmowę, w której uwzględnia wiele różnych intencji. Kryją się tu jednak trzy zasadnicze pułapki. Jakie?
Po pierwsze – ponieważ voicebot oparty na ChatGPT zna odpowiedzi na wiele różnych pytań właściwie z dowolnej dziedziny i jego pomysłowość nie jest niczym ograniczona – rozmowa ma dużą szansę zabrnąć w ślepy zaułek, a jej cel rozmyć się w licznych dygresjach.
A przecież dobry voicebot jest stworzony do tego, żeby rozwiązać konkretny problem dzwoniącego (oszczędzając czas zarówno użytkownika, jak i firmy), a nie prowadzić z nim niekończące się pogawędki, choć może to być kuszące.
Drugą kwestią jest wiarygodność udzielanych odpowiedzi – ponieważ ChatGPT karmiony jest ogromnymi ilościami danych z różnych źródeł, kontrola nad tymi informacjami jest właściwie niemożliwa i mogą pojawić się błędy.
Odpowiedzią na te dwie kwestie jest mądre ograniczanie nieokiełznanej kreatywności ChatGPT poprzez zmuszanie go do powrotu do tematu rozmowy oraz dodanie bazy poprawnych odpowiedzi, co też jest powszechnie stosowane w opartych na tym rozwiązaniu voicebotach.
Trzecim problemem, który obecnie, z punktu widzenia technologii, nie ma dobrego rozwiązania, są opóźnienia w udzielaniu odpowiedzi przez ChatGPT, co związane jest z koniecznością “przeczesania” przez niego całej rozległej bazy informacji. Podczas gdy w przypadku rozwiązania tekstowego nie ma to większego znaczenia, w przypadku rozmowy głosowej może znacznie zaburzyć jej płynność i na dłuższą metę zirytować dzwoniącego.
Podsumowanie: dostawcy chatbotów vs dostawcy voicebotów
Inwestycja w szybko rozwijające się technologie do automatyzacji komunikacji, takie jak voicebot, wymaga czasu i energii. Chociaż wybór dostawcy chatbota z dużym doświadczeniem i dobrą reputacją na rynku konwersacyjnej AI może wydawać się atrakcyjny, należy pamiętać, że sposób komunikacji chatbotów znacznie różni się od sposobu komunikacji voicebotów, które są tworzone od podstaw.
Niektóre przewagi dostawców voicebotów, takie jak doświadczenie w obszarze głosowej interakcji człowiek–bot i projektowania komunikacji parawerbalnej oraz infrastruktura telekomunikacyjna, pozwalają im tworzyć produkty najwyższej klasy.
Czy wiesz, że współpracując z Apifonica, możesz skorzystać ze wszystkich przewag eksperckiego dostawcy voicebotów? Chętnie Ci o tym opowiemy – zarezerwuj spersonalizowane demo, by odkryć nasze rozwiązania!
Współautorka artykułu: Sofia Carvalho e Pereira.