12.03.2024

Co musisz potrafić, żeby tworzyć wysokiej jakości voiceboty?

Główkujecie nad tym, jakie umiejętności są niezbędne do tworzenia wysokiej jakości voicebotów? Rozwiejemy Wasze wątpliwości z pomocą Tomasza Stachlewskiego z AWS. Sprawdźcie, czy macie co trzeba, żeby dołączyć do zespołu budującego voiceboty.

12.03.2024, added by Laura Kszczanowicz | Infoshare

W świecie, gdzie automatyzacja obejmuje coraz więcej obszarów codziennego życia, voiceboty stają się coraz powszechniejszym rozwiązaniem stosowanym w wielu różnych branżach. Intensywny rozwój sztucznej inteligencji sprawia, że boty stanowią coraz lepszą alternatywę dla tradycyjnej obsługi klienta, jednak żeby interakcja z nimi przypominała prawdziwą rozmowę, niezbędny jest kompetentny zespół specjalistów z branży IT. Jakie umiejętności są niezbędne do tworzenia skutecznych voicebotów? Sprawdźcie już teraz!

Voiceboty to praca zespołowa

Tym, co wyróżnia pracę nad stworzeniem voicebota jest fakt, że jest to zadanie zespołowe, wymagające często niemałej kreatywności i żyłki naukowca. Zespół składa się z developerów, specjalistów z zakresu sztucznej inteligencji oraz osób odpowiedzialnych za obszar conversation design.

Każda z grup w całym zespole ma swoje specyficzne zadania. Niektóre wymagają wręcz humanistycznych predyspozycji. Zaintrygowani? Jeśli myśleliście, że praca w IT to nic poza „klepaniem kodu”, zostańcie ze mną. Przekonacie się, że kodowanie to tylko jedna z dróg dla programisty. A jakie są inne możliwości?

Lubimy kodować… i co nam zrobicie?

Zawsze znajdzie się dla Was miejsce w teamie developerów. Zespół tworzący voiceboty nie obejdzie się bez klasycznego programisty. Tym, czym powinni się cechować developerzy rozwijający voiceboty są umiejętności miękkie. Zwłaszcza w kontekście pracy zespołowej. A z rzeczy technicznych?

Przy pracy nad voicebotami korzysta się m.in. z języków Java, Python i JavaScript. Dodatkowo przydaje się znajomość frameworków do przetwarzania języka naturalnego (np. NLTK czy spaCy). Nie bez znaczenia jest także wiedza z zakresu ASR (automatycznego rozpoznawania mowy). Podczas tworzenia voicebotów z pomocą przychodzą także rozwiązania chmurowe.

Chmura stała się istnym katalizatorem budowy aplikacji sterowanych głosowo – mówi Tomasz Stachlewski, Head of Technology w AWSJeszcze do niedawna budowa voicebotów wymagałaby niemałego zespołu specjalistów, z których połowa pewnie posiadałaby doktorat z bardzo specjalizowanych zagadnień IT – na szczęście te czasy są już przeszłością. Chmura obliczeniowa dostarcza bowiem szereg gotowych funkcjonalności, określanych jako usługi chmurowe, bądź jak ja lubię je zwać chmurowe klocki lego. Przykładem może być np. dostępna w AWS usługa Polly – ten chmurowy klocek stworzony w Gdańsku pozwala bowiem zamieniać tekst w naturalnie brzmiący dźwięk! Wykorzystanie takich gotowych elementów przyśpiesza i usprawnia tworzenie własnych voicebotów.

Ci od naukowych zadań specjalnych

Rola AI w voicbotach to przede wszystkim dostarczenie wszystkich tych informacji, które pozwolą botom rozumieć kontekst i rozkładać wypowiedzi. Dzięki sztucznej inteligencji Wasz „automatyczny konsultant” będzie wiedział, o jakie informacje dopytać i jak udzielać trafnych odpowiedzi na pytania odbiorców. Skuteczne trenowanie voicebotów jest jednak nie lada wyzwaniem. Dlaczego?

W odróżnieniu od developerów, którzy dysponują znanymi i gotowymi narzędziami, spece od AI muszą śledzić coraz to nowe doniesienia z placu boju. Sztuczna inteligencja rozwija się w takim tempie, że trudno nadążyć za nowymi propozycjami rozwiązań, co więcej, większość z nich ma charakter dość eksperymentalny. Implementując świeży pomysł, można jedynie zakładać, jaki efekt faktycznie osiągniemy, dlatego też trenowanie voicebotów to nieustająca przygoda.

Humaniści w natarciu — słówko o conversation designerach

Conversation designerzy są dla voicebotów, trochę jak autorzy skryptów w call center. Można powiedzieć, że to tacy eksperci od user experience dla użytkowników głosowych asystentów. Ich zadaniem jest projektowanie wypowiedzi botów w ten sposób, żeby ich treść była jasna i zrozumiała dla odbiorcy.

Ta część zespołu dba o dopasowanie komunikatu do rozmówcy na podstawie różnorodnych danych np. na podstawie wieku (kiedy użytkownik dokonuje weryfikacji, podając pesel). W jaki sposób zadać pytanie, jakie informacje powinien podać bot w odpowiedzi, jak uczynić rozmowę bardziej „ludzką” i przyjemną? Na to pytanie codziennie próbują sobie odpowiedzieć osoby zajmujące się conversation designem.

Świetnym sposobem na przetestowanie swoich umiejętności w projektowaniu optymalnych interfejsów głosowych będzie znana wszystkim Alexa – kontynuuje Tomasz Stachlewski która dostarcza łatwo rozszerzalny interfejs głosowy, który możemy wykorzystać (za darmo!), aby projektować własne aplikacje głosowe, które określane są jako tzw. skille. Widać wówczas jak bardzo istotnym stają się nie tyle umiejętności programistyczne – bo tego nie trzeba w ogóle, aby zaprojektować swojego własnego skilla – ale umiejętności optymalnego zaprojektowaniu komunikacji głosowej pomiędzy człowiekiem a komputerem. Co zrobić, aby taka komunikacja nie męczyła rozmówcy, nie była uciążliwa tylko sprawna, prawdziwa i szybka? Tutaj właśnie na scenę wchodzą projektanci konwersacji głosowych!

Jak stworzyć skutecznego voicebota? - Zadania i wyzwania programistów

Uwalacie, że macie to coś, żeby stać się częścią zespołu tworzącego voiceboty? To świetnie! Przejdźmy do tego, jakie wyzwania czekają na Was po drodze. Gotowi? No to lecimy z tematem!

Krok pierwszy: żeby działało

Bot w trakcie rozmowy nagrywa i przekształca usłyszane informacje na tekst, po czym generuje odpowiedź na podstawie dostępnych informacji. Następnym krokiem jest werbalne przekazanie odpowiedzi rozmówcy. Wszystko wydaje się być nieskomplikowane, ale już tu czeka Was wiele znaków zapytania i wyzwań.

Skąd bot ma brać informacje?

Podstawowym źródłem informacji jest oczywiście rozmówca. Bot zadaje pytania odbiorcy i gromadzi dane niezbędne do realizacji celu. Dodatkowym źródłem cennych informacji może być zewnętrzna baza np. CRM, ale w wielu przypadkach zadawanie pytań i uzyskiwanie konkretnych odpowiedzi jest niezbędne do realizacji celów rozmów. Kolejna prosta sprawa, a trudności coraz więcej.

Jak zadawać pytania?

Załóżmy, że Wasz bot obsługuję sieć salonów optycznych, a klient dzwoni w celu umówienia wizyty. Wizyta może obejmować także badanie okulistyczne, w takim przypadku bot musi umówić wizytę w takim terminie, w którym taka usługa będzie możliwa do zrealizowania. Asystent głosowy powinien także rozumieć różne typy odpowiedzi. Rozmówca zapytany o to, w którym oddziale chce umówić wizytę, może odpowiedzieć, że na ul. Chodowieckiego, ale może podać, że w salonie w Gdańsku we Wrzeszczu. Bot musi wiedzieć, który adres znajduje się na Woli lub dopytać o nazwę ulicy.

Krok drugi: żeby było coraz skuteczniej

Samo stworzenie narzędzia, które w miarę trafnie odpowiada na pytania, czy umawia wizyty, jest jednak wierzchołkiem góry lodowej. Praca przy rozwijaniu voicebotów to masa eksperymentów. Jeśli chcecie się tym zajmować, czekają Was testy, testy i… jeszcze więcej testów.

Głos to ważna sprawa

Opcje są dwie: albo głos z syntezatora, albo stworzony na podstawie nagrań. Jaki głos będzie lepszy? Męski, żeński, wyższy, niższy - na to pytanie odpowiedzą… testy ;)

Personalizacja — tak, czy nie?

Powiedzmy, że Wasze rozwiązanie, ma zachęcić klienta do przedłużenia ubezpieczenia mieszkania. Wiecie, że klient to pan Marek i mieszka w Warszawie na ul. Powstańców Wielkopolskich. Wasz voicebot wita się więc, używając imienia Pana Marka i wspomina o ubezpieczeniu mieszkania, ale pan Marek od roku mieszka w nowym lokalu na ul. M. Konopnickiej, więc się rozłącza, myśląc, że to pomyłka. Gdyby bot nie podał dokładnego adresu, być może pan Marek wysłuchałby ofert do końca.

Zrozumiała odpowiedź

Wasz voicebot podaje informacje o kursie, który odbywa się online i jest realizowany przez uniwersytet znajdujący się na ulicy Poniatowskiego? Potencjalny uczestnik myśli sobie: „Gdzie? Przecież miało być online?” Warto zweryfikować, które warianty odpowiedzi będą najbardziej zrozumiałe.

Krok trzeci: szukanie i naprawianie problemów

Decydując się na tworzenie botów, musicie być gotowi na analizowanie wielu aspektów ich działania. Przydatne bywa poszukiwanie niedoskonałości na podstawie tego, do jakiego etapu rozmowy dociera użytkownik. W ten sposób można znaleźć element, który nie działa tak, jak należy. Teraz pozostało tylko wymyślenie kolejnej wersji pytania, czy odpowiedzi i… testy.

Wysokiej jakości voiceboty? Stać Was na to!

Przygotujcie się do wielu fascynujących wyzwań! Zespół pracujący na voicebotem musi być interdyscyplinarny i gotowy na rozwiązywanie wielu nietypowych dla programistów problemów. Jeśli lubicie zadania wymagające analitycznego podejścia i rozważania różnych możliwych rozwiązań, tworzenie voicebotów może być w sam raz dla Was.

Tags:

LATEST NEWS

Tags

HAVE ANY IDEA FOR CONTENT?

Contact the editorial team at:

news@infoshare.pl