Jak korzystać z narzędzia Ngram Viewer w Google Books

Spisu treści:

Jak korzystać z narzędzia Ngram Viewer w Google Books
Jak korzystać z narzędzia Ngram Viewer w Google Books
Anonim

Co warto wiedzieć

  • W przeglądarce Ngram Google Books wpisz frazę, wybierz zakres dat i korpus, ustaw poziom wygładzania i kliknij Przeszukaj wiele książek.
  • Możesz zagłębić się w dane. Na przykład, aby wyszukać formę czasownika fish, zamiast rzeczownika fish, użyj znacznika: szukaj fish_VERB.
  • Ngram Viewer wyświetla wykres przedstawiający użycie frazy w czasie. W przypadku wielu fraz każda z nich jest reprezentowana przez linię oznaczoną kolorem.

W tym artykule wyjaśniono, jak używać narzędzia Ngram Viewer w Książkach Google do prowadzenia badań i wyszukiwania zaawansowanego.

Image
Image

Jak działa przeglądarka Ngram

Ngram, zwany także N-gramem, to statystyczna analiza treści tekstu lub mowy w celu znalezienia n (liczby) jakiegoś elementu w tekście.

Pozycją wyszukiwania mogą być różne rzeczy, w tym fonemy, przedrostki, frazy i litery. Chociaż Ngram jest nieznany poza społecznością naukową, jest używany w różnych dziedzinach i ma wiele implikacji dla programistów kodujących programy komputerowe rozumiejące i reagujące na naturalny język mówiony.

W przypadku Google Books Ngram Viewer analizowany tekst pochodzi z ogromnej liczby książek w domenie publicznej, które firma Google zeskanowała, aby zapełnić swoją wyszukiwarkę Google Books. W przypadku Google Books Ngram Viewer Google określa treść tekstu, który zamierzasz przeszukać, jako korpus. Przeglądarka Ngram agreguje według języka, chociaż można osobno analizować angielski brytyjski i amerykański lub łączyć je razem.

  1. Przejdź do Google Books Ngram Viewer na books.google.com/ngrams.
  2. Wpisz dowolną frazę lub frazy, które chcesz przeanalizować. Oddziel każdą frazę przecinkiem. Na początek Google sugeruje „Albert Einstein, Sherlock Holmes, Frankenstein”.

    W wyszukiwaniach NGram Viewer w elementach rozróżniana jest wielkość liter, w przeciwieństwie do wyszukiwań internetowych Google.

  3. Wybierz zakres dat. Wartość domyślna to 1800 do 2000.
  4. Wybierz korpus. Możesz wyszukiwać teksty w języku obcym lub w języku angielskim, a oprócz standardowych opcji na dole listy możesz zauważyć wpisy takie jak „Angielski (2009)” lub „Amerykański angielski (2009)”. Są to starsze korporacje, które firma Google zaktualizowała od tego czasu, ale możesz mieć jakiś powód, aby dokonać porównań ze starymi zestawami danych. Większość użytkowników może je zignorować i skupić się na najnowszych korpusach.
  5. Ustaw poziom wygładzania. Wygładzanie odnosi się do tego, jak gładki jest wykres na końcu. Najdokładniejsza reprezentacja odzwierciedla poziom wygładzania równy 0, ale to ustawienie może być trudne do odczytania. Wartość domyślna to 3. W większości przypadków nie trzeba jej zmieniać.

  6. Naciśnij Przeszukaj wiele książek.

Korzystając z Google Ngram Viewer, możesz zagłębić się w dane. Jeśli chcesz wyszukać czasownik fish zamiast rzeczownika fish, możesz to zrobić za pomocą tagów. W takim przypadku wyszukasz fish_VERB.

Google udostępnia na swojej stronie internetowej kompletną listę poleceń i innej zaawansowanej dokumentacji do użytku z programem Ngram Viewer.

Dolna linia

Google Books Ngram Viewer wyświetla wykres przedstawiający użycie określonej frazy w książkach w czasie. Jeśli wprowadzono więcej niż jedno słowo lub frazę, każde z nich jest reprezentowane przez kolorową linię, która kontrastuje z innymi wyszukiwanymi hasłami. Jest to podobne do Trendów Google, tylko wyszukiwanie obejmuje dłuższy okres.

Studium przypadku

Rozważ studium przypadku ciast z octem. Wspomniano o nich w serialu Mały domek na prerii Laury Ingalls Wilder. Wyszukiwanie za pomocą wyszukiwarki Google, aby dowiedzieć się więcej o plackach z octem, ujawnia, że są one uważane za część amerykańskiej kuchni południowej i rzeczywiście są przyrządzane z octu. Wracają do czasów, kiedy nie wszyscy mieli dostęp do świeżych produktów o każdej porze roku, ale czy to cała historia?

Przeszukaj przeglądarkę Ngram Google pod kątem ciasta z octem, a natkniesz się na kilka wzmianek o cieście zarówno z początku, jak i końca XIX wieku, wiele wzmianek z lat 40. i coraz więcej wzmianek w ostatnim czasie. Jednak przy poziomie wygładzania 3 widać plateau nad wzmiankami z XIX wieku. Ponieważ w tym czasie nie opublikowano zbyt wielu książek, a dane są ustawione na wygładzenie, obraz jest zniekształcony. Prawdopodobnie tylko jedna książka wspomniała o cieście z octem i została uśredniona, aby uniknąć kolca. Ustawiając wygładzanie na 0 widać, że tak właśnie jest. Wyskok koncentruje się na 1869 r., a kolejny wyskok ma miejsce w latach 1897 i 1900.

Jest mało prawdopodobne, że przez resztę czasu nikt nie mówił o plackach z octem: prawdopodobnie wszędzie krążyły przepisy, ale ludzie nie pisali o nich w książkach, a to jest ważne ograniczenie wyszukiwania Ngramów.

Zalecana: