
Essential Voice to kolejny dowód na to, że sztuczna inteligencja w smartfonach może być naprawdę przydatna.
Dyktowanie wiadomości dostępne jest w Androidzie od 2011 roku, ale wciąż jest to rozwiązanie dalekie od doskonałego. Domyślna funkcja po prostu stara się zamienić na tekst każde wypowiedziane słowo, w tym zbędne powtórzenia, a całość zazwyczaj i tak trzeba później formatować ręcznie.
Interpunkcja? W języku polskim pisanie głosowe Google wymaga używania komend typu "przecinek", co nie jest specjalnie intuicyjne. Na szczęście ktoś postanowił zrobić to lepiej.
Essential Voice, czyli pisanie głosowe po nowemu
Firma Nothing wprowadziła na swoje wybrane smartfony funkcję Essential Voice, która odpowiada za transkrypcję mowy, ale z użyciem generatywnej sztucznej inteligencji. Aktualnie rozwiązanie to bazuje na dużym modelu językowym Gemini 3.0 Flash.
Algorytm automatycznie:
- usuwa pauzy, zająknięcia, powtórzenia i tzw. wypełniacze (np. "yyy", "eee");
- nakłada interpunkcję bez konieczności wypowiadania komend typu "kropka" czy "znak zapytania";
- zmienia przejęzyczenia i źle użyte słowa na poprawne.
Tutaj mały pokaz działania Essential Voice w praktyce:
Nową funkcję można aktywować przyciskiem Essential Key na obudowie lub wirtualnym klawiszem pod klawiaturą Gboard. Essential Voice działa z każdym polem tekstowym w Androidzie i obsługuje ponad 100 języków (w tym polski).
Producent zaimplementował także funkcję mapowania fraz, dzięki której można np. przypisać konkretny adres e-mail do frazy "mój e-mail".
Dodatkowo Essential Key odróżnia dyktowanie od komend głosowych, więc na koniec wypowiedzi można dorzucić polecenie typu "wypunktuj tę listę" lub "przetłumacz to na francuski", a telefon je wykona.
Minusy? Jako że Essential Voice bazuje na LLM-ach, wszystkie transkrypcje wykonywane są w chmurze, więc funkcja wymaga połączenia z internetem i działa z kilkusekundowym opóźnieniem. Co prawda Nothing deklaruje, że nagrania usuwane są z serwerów natychmiast po przetworzeniu, ale standardowe pisanie głosowe na wielu telefonach potrafi działać znacznie szybciej i to offline. Z mojego doświadczenia wynika też, że Essential Voice najlepiej radzi sobie z długimi frazami, bo gdy dyktuję 1-3 słowa, to zdarza się, że AI błędnie rozpoznaje język i wstawia tekst po chińsku czy hiszpańsku.
Tak czy inaczej, Essential Voice to w mojej ocenie jedno z najbardziej praktycznych zastosowań AI w smartfonach. Po raz pierwszy czuję, że w 95 proc. sytuacji mógłbym wprowadzać tekst bez dotykania ekranowej klawiatury.
W pierwszej kolejności funkcja Essential Voice trafiła wraz z aktualizacją systemu na telefony Nothing Phone (3) i Nothing Phone (4a) Pro, a jeszcze w maju ma zostać udostępniona użytkownikom modelu (4a).






Komentarze
2