6 listopada mija dokładnie dziesięć lat od momentu, kiedy pojawiła się Alexa. Ten asystent głosowy dostępny na niewielkim urządzeniu w krótkim czasie zrewolucjonizował podejście do wykorzystania nowoczesnych rozwiązań w codziennym życiu. Alexa stała się nie tylko nieodłącznym elementem milionów domów na całym świecie, ale też zapoczątkowała nową erę interakcji człowiek-technologia.
Gdy Amazon wprowadzał Alexę w 2014 roku, wielu z początkowych użytkowników postrzegało ją jako technologiczną „osobliwość”. Kto chciałby rozmawiać z głośnikiem? Czy nie wystarczy aplikacja na smartfona? Jej twórcy mieli jednak wizję, którą realizowali od lat – stworzenie inteligentnego asystenta, który umożliwi ludziom interakcję z technologią w sposób tak naturalny, jak rozmowa z drugim człowiekiem. Alexa miała być czymś znacznie więcej niż tylko asystentem głosowym – miała stać się „cyfrowym domownikiem” odpowiedzialnym za kontrolę inteligentnych urządzeń, wyszukiwanie informacji, tworzenie list zakupów czy zarządzanie naszymi harmonogramami. Jej głównym atutem była prostota – wystarczyło jedno słowo kluczowe („Alexa”), aby aktywować system i zadać pytanie lub wydać polecenie. Tak narodziła się rewolucja, której mało kto się spodziewał.
Technologia z polskim rodowodem
W procesie powstawania systemu kluczową rolę odegrali polscy inżynierowie. Ważnym krokiem na drodze do sukcesu Alexy było przejęcie przez Amazon polskiej firmy IVONA Software, która już w latach 2000. rozwijała własnego asystenta głosowego. IVONA była rodzimym liderem w dziedzinie syntezy mowy, a jej technologie umożliwiały generowanie naturalnie brzmiących głosów.
Firma IVONA Software, założona w Gdyni, zaczynała jako niewielki startup, którego głównym celem było tworzenie realistycznej syntezy mowy. Twórcy IVONY, Michał Kaszczuk i Łukasz Osowski, 20 lat temu stworzyli firmę technologiczną, by rozwijać innowacyjne projekty związane z technologią text-to-speech. We wspomnieniach osób, które pamiętają początki tego przedsięwzięcia, jednogłośnie podkreślana jest bardzo dobra, niemal rodzinna atmosfera, panująca w zespole.
Rodzinną atmosferę w firmie najlepiej dało się dostrzec podczas naszych wspólnych wyjazdów na kajaki czy firmowych ognisk. Wtedy najbardziej odczuwałem, że osoby wokół to nie tylko moi współpracownicy, ale także przyjaciele – wspomina w najnowszym odcinku podcastu ALEXA STAGE, Adam Nadolski, principal engineer, Amazon.
Początkowo IVONA zdobyła uznanie głównie w branży telekomunikacyjnej i technologicznej, a system stosowany był w aplikacjach dla osób słabowidzących, w nawigacji GPS czy czytnikach e-booków. Najważniejszym osiągnięciem IVONY była zdolność do generowania syntezowanych głosów, które brzmiały naturalnie, co odróżniało ją od większości konkurencyjnych rozwiązań. Dzięki tej technologii „mowa” wirtualnych asystentów przestała brzmieć mechanicznie i „sztucznie”.
Obszar działań startupu był wówczas na tyle interesujący, że szybko znalazł się pod obserwacją światowych potentatów. Finalnie w 2013 r. kupił ją stworzony przez Jeffa Bezosa Amazon. Na bazie spółki Ivona Software w Pomorskim Parku Naukowo-Technologicznym (później w gdańskim Olivia Business Center) firma zbudowała prawdziwą potęgę w stosunkowo młodym segmencie inteligentnych asystentów głosowych.
Tajne przez poufne
Pomysł wydawał się dość radykalny. Ówcześnie dyskutowano bowiem o tym, jak duży smartfon i jakich rozmiarów wyświetlacz można zaprojektować. Amazon wytyczył sobie zaś zupełnie inną ścieżkę – stworzyć urządzenie bez ekranu, którego nie da się schować do kieszeni, za to można obsługiwać je głosem. Projekt Alexy objęty został ścisłą poufnością, a w gronie osób pracujących nad technologią nadano jej przydomek „projekt D”.
Samo przejęcie IVONA Software przez Amazon z początku owiane było tajemnicą, co rodziło szereg wyzwań, np. w zakresie rekrutacji. Z jednej strony projekt wymagał zatrudnienia wielu dodatkowych inżynierów, z drugiej rekrutację prowadzono pod szyldem małego startupu, który musiał konkurować ze znacznie większymi brandami. Stąd dzień, kiedy logotyp IVONA Software zastąpiono logo Amazon, był dla wielu niemałym zaskoczeniem.
Dokąd zmierza przyszłość?
Na początku Alexa była przede wszystkim narzędziem do odtwarzania muzyki i wyszukiwania informacji w internecie. Z czasem jej funkcje zaczęły się jednak rozwijać, a Amazon regularnie wprowadzał aktualizacje, które wzbogacały jej możliwości. Dziś, dzięki integracjom z innymi urządzeniami IoT (Internet of Things), Alexa stała się np. interfejsem do zarządzania inteligentnymi domami. Stanowi także ułatwienie w codziennym życiu osób starszych, którym ułatwia m.in. wezwanie pomocy.
Możemy spodziewać się, że w przyszłości Alexa stanie się jeszcze bardziej „inteligentna” – być może w pełni zrozumie nasze emocje i intencje, a interakcje z nią będą jeszcze bardziej naturalne. Bez wątpienia jej historia jest przykładem na to, jak małe innowacje mogą przekształcić się w globalne rewolucje technologiczne.