Kluczowe dania na wynos
- Nowe technologie mogą doprowadzić do powstania komputerów, które lepiej rozumieją ludzką mowę.
- Microsoft i NVIDIA ogłosiły niedawno nową metodę interpretacji języka opartą na sztucznej inteligencji.
- Obliczenia kwantowe mogą być kolejnym sposobem na rozwój dziedziny przetwarzania języka.
W dzisiejszych czasach istnieje wiele inteligentnych gadżetów do wydawania poleceń, ale wciąż jesteśmy daleko od komputerów, które rozumieją mowę konwersacyjną.
Microsoft i NVIDIA ogłosiły niedawno nową, opartą na sztucznej inteligencji metodę interpretacji mowy, która może zmienić sposób, w jaki rozmawiamy z naszymi urządzeniami elektronicznymi. Jest to część rozwijającego się ruchu zmieniającego sposób, w jaki komputery rozumieją mowę, zwanego także przetwarzaniem języka naturalnego (NLP).
„Modele napędzające NLP stają się coraz większe i bardziej zaawansowane i zbliżają się do ludzkiego zrozumienia” – powiedział Lifewire Hamish Ogilvy, ekspert ds. sztucznej inteligencji w wywiadzie e-mailowym.
Jednym z wielkich postępów jest to, że NLP wychodzi poza proste słowa kluczowe. Być może jesteś dziś przyzwyczajony do wpisywania lub wypowiadania jednego lub dwóch słów kluczowych, aby uzyskać wyniki wyszukiwania, ale nowsze modele przetwarzania języka naturalnego wykorzystują kontekst, aby zapewnić bogatsze wyniki”.
Chat Boty
NVIDIA i Microsoft połączyły siły, aby stworzyć model Megatron-Turing Natural Language Generation (MTNLG), który według duetu jest „najpotężniejszym modelem monolitycznego języka transformatora do tej pory”. Model AI działa na superkomputerach.
Ale naukowcy odkryli, że model MTNLG wychwytywał ludzkie uprzedzenia, przeczesując góry próbek ludzkiej mowy.
„Podczas gdy gigantyczne modele językowe rozwijają stan wiedzy w zakresie generowania języka, cierpią również z powodu problemów, takich jak stronniczość i toksyczność” – napisali naukowcy w poście na blogu. „Nasze obserwacje z MT-NLG wskazują, że model wychwytuje stereotypy i uprzedzenia z danych, na których jest szkolony”.
Komputery, które lepiej rozumieją mowę, nie tylko poprawią inteligentne głośniki, takie jak Alexa, twierdzi Ogilvy. Strony wyszukiwania tekstowego, takie jak Amazon, również lepiej zrozumieją wpisywane zapytania.
„Google ma tu wyraźną przewagę, ale technologia NLP będzie wszędzie” – powiedział Ogilvy. „W przypadku wyszukiwania tekstowego i głosowego użytkownicy mogą być bardziej opisowi, ponieważ NLP rozumie więcej niż tylko tekst; rozumie kontekst tego, czego szukasz, aby uzyskać lepsze wyniki.„
Czaty kwantowe?
Przetwarzanie kwantowe może być jednym ze sposobów na postęp w dziedzinie NLP. W środę firma Cambridge Quantum ogłosiła lambeq, który, jak twierdzi, jest pierwszym zestawem narzędzi kwantowych dla NLP.
…NLP rozumie więcej niż tylko tekst; rozumie kontekst tego, czego szukasz, aby uzyskać lepsze wyniki.
Firma twierdzi, że narzędzie umożliwia tłumaczenie zdań w językach naturalnych przy użyciu obwodów kwantowych działających na komputerach kwantowych. Obliczenia kwantowe to rodzaj obliczeń, który do wykonywania obliczeń wykorzystuje niezwykłe właściwości stanów kwantowych, takie jak superpozycja, interferencja i splątanie.
„Sposób, w jaki komputery kwantowe radzą sobie z NLP, bardzo różni się od klasycznych maszyn. W rzeczywistości NLP jest „natywnie kwantowe”” – powiedział Lifewire Bob Coecke, główny naukowiec w Cambridge Quantum. „Wynika to z odkrycia, którego dokonaliśmy kilka lat temu, że gramatyka rządząca zdaniami i znaczeniem ma bardzo podobną strukturę do matematyki używanej do programowania komputerów kwantowych.„
Coecke powiedział, że kwantowe NLP może prowadzić do lepszych asystentów głosowych i narzędzi tłumaczeniowych.
Kolejne obiecujące podejście do poprawy rozpoznawania mowy, Zac Liu, analityk danych w firmie Hypergiant, powiedział Lifewire w rozmowie e-mailowej. „Krótko mówiąc, kiedy naukowcy zajmujący się danymi ulepszają dane NLP, prawie gwarantuje to, że będą mieli lepszy model NLP i lepsze możliwości NLP”.
Następnym krokiem jest integracja modeli widzenia komputerowego z NLP, na przykład szkolenie modelu AI w celu oglądania filmów i tworzenia podsumowania tekstowego tego filmu, powiedział Liu.
„Zastosowanie tego postępu może być nieograniczone, od opieki zdrowotnej, czytania filmów radiologicznych i wstępnej diagnozy, po projektowanie domów, ubrań, biżuterii lub podobnych przedmiotów” – dodał. „Klient mógł wyjaśnić wymagania ustnie lub pisemnie, a opis ten może zostać automatycznie przekonwertowany na obrazy lub filmy w celu lepszej wizualizacji.„