Jak płynne rozpoznawanie głosu pozostaje szybkie, dokładne i prywatne

Spisu treści:

Jak płynne rozpoznawanie głosu pozostaje szybkie, dokładne i prywatne
Jak płynne rozpoznawanie głosu pozostaje szybkie, dokładne i prywatne
Anonim

Kluczowe dania na wynos

  • Fluent to szanujący prywatność, superszybki silnik rozpoznawania głosu, który nie wymaga połączenia z Internetem.
  • Może być osadzony w prawie każdym urządzeniu.
  • Działa w każdym języku.
Image
Image

Fluent.ai to wirtualny silnik rozpoznawania głosu, który nie wysyła poleceń do Internetu, działa niemal natychmiast, może pracować w dowolnym języku i jest tak mały, że można go wbudować w nawet tani, niski -zasilanie urządzeń, takich jak np. zegarek fitness.

W przeciwieństwie do Siri i Alexy, Fluent jest samodzielnym asystentem, który natychmiast Cię rozumie i uczy się od Ciebie, więc im więcej z niego korzystasz, tym lepiej. Nie ma głębi zwykłych wirtualnych asystentów, ale nie jest to przeznaczone. Zamiast tego jest szybszy, dokładniejszy i bardziej prywatny niż wysiłki Apple, Amazon i Google.

„Mowa na tekst wykorzystuje przetwarzanie języka naturalnego, a następnie czerpie intencję” – powiedział Lifewire dyrektor generalny Fluent Probal Lala podczas wywiadu dla Zoom. „Wymaga dużej ilości danych i dużej mocy obliczeniowej. Fluent przechodzi bezpośrednio od mowy do intencji, zabierając głos i przekształcając go bezpośrednio w działanie.”

Dolna linia

Fluent to oprogramowanie do sterowania głosem. Działa, słuchając twojego polecenia i usuwając wszystkie niepotrzebne słowa, pozostawiając tylko podstawowe rzeczowniki i czasowniki. „Wyłącz światła”, po prostu zgaśnie i zapali się. Istotne elementy zostają odarte z nieuporządkowanego ludzkiego zdania i zamienione w kroki. To prawie jak programowanie komputera, przekształcanie złożonego pomysłu w najprostszy zestaw instrukcji.

Do czego można go wykorzystać?

Fluent może być używany do wszystkiego. Kluczem jest to, że jest wyszkolony do konkretnej sytuacji. Na przykład za pomocą inteligentnego zegarka można go szkolić w zakresie poleceń dotyczących fitnessu lub automatyki domowej, tworzenia kalendarza i timera i tak dalej. Ograniczenie bazy danych sprawia, że wszystko jest bardziej skoncentrowane i przyspiesza.

„Prawda jest taka, że w przypadku urządzeń do noszenia nie chcesz rozmawiać”, powiedziała Lala, „Chcę, aby mój ulubiony program ćwiczeń zaczął się i chcę go bardzo szybko”.

Najważniejsza jest szybkość i dokładność. Włączanie i wyłączanie świateł zajmuje milisekundy, zamiast czekać, aż Siri wyśle Twój głos do chmury, poczekaj, aż zostanie przetworzony, a następnie – kilka sekund później – zgasną światła.

To wąskie szkolenie również zmniejsza rozmiar aplikacji. W zeszłym roku Google udostępnił do pobrania wersję swojego asystenta offline. To było, jak mówi Lala, 85 megabajtów, pracowało tylko w języku angielskim, a wyszkolenie go zajęło sześć miesięcy.

„Mamy jeden model pracujący z 13 000 poleceń i działa on w 500 kilobajtach”, powiedział.

Dolna linia

Inną zaletą silnika rozpoznawania głosu w trybie offline jest prywatność. Na przykład w inteligentnym zegarku dla dzieci „nie chcesz, aby głos dziecka trafiał do chmury”, mówi Lala. W rzeczywistości Fluent może działać w urządzeniach, które nigdy nie łączą się z Internetem. Jest to dobre nie tylko dla prywatności, ale także dla bezpieczeństwa. Możesz użyć silnika rozpoznawania głosu offline w laboratoriach badawczych, instalacjach wojskowych i innych miejscach, w których zakazane jest używanie telefonów komórkowych i kamer.

Limity

Oczywiście, ten model ma pewne wady. Jednym z nich jest to, że poleceń nie można później dodać. Po zakończeniu wstępnego szkolenia to wszystko. Twój asystent Fluent nie może też wyszukiwać w Internecie wyników sportowych, aktora, którego rozpoznajesz w tym filmie, ale po prostu nie może go umieścić i tak dalej.

Image
Image

Zamiast tego system jest wystarczająco inteligentny, aby rozpoznać, kiedy nie może pomóc i przekaże żądanie komuś, kto może. Jeśli poprosisz zegarek o prognozę pogody, Fluent zorientuje się, że nic nie rozumie. „Następnie zadzwoni do usługi wstępnie zaprogramowanej w zegarku, niezależnie od tego, czy będzie to Alexa Amazona, czy Google, a następnie nawiąże połączenie z chmurą”, przekazując swoje surowe polecenie głosowe, aby uzyskać odpowiedź.

To hybrydowe podejście zachowuje szybkość lokalnego asystenta offline, z mocą Alexy lub Asystenta Google jako kopii zapasowej.

Czy możesz kupić dowolne urządzenia Fluent?

Jeszcze nie. Firma licencjonuje swoją technologię i prowadzi szkolenia dla innych firm. Dzięki COVID dwie główne premiery zostały przesunięte na przyszły rok. Ale możesz spodziewać się, że pojawi się w zegarkach i innych urządzeniach fitness, głośnikach, koncentratorach automatyki domowej itd.

Byłoby wspaniale, gdyby zostało to również włączone bezpośrednio do smartfonów, takich jak iPhone, przyspieszając codzienne zadania i korzystając z Siri tylko wtedy, gdy jest to konieczne. To byłaby prawdziwa zabójcza aplikacja.

Aktualizacja: 22 października, 10:12. Wprowadzono zmiany, aby odnosić się do Fluent jako mechanizmu rozpoznawania głosu, a nie asystenta głosowego.

Zalecana: