Kluczowe dania na wynos
- Nowe narzędzie oparte na sztucznej inteligencji może pomóc historykom w rozszyfrowaniu starożytnych tekstów.
- Ithaca to pierwsza głęboka sieć neuronowa, która może przywrócić brakujący tekst uszkodzonych napisów, zidentyfikować ich pierwotną lokalizację i pomóc ustalić datę ich utworzenia.
- AI jest przydatna do uzupełniania brakujących danych, takich jak lokalizacja i data tekstu, ponieważ dobrze uczy się bardzo złożonych wzorców poprzez analizę danych.
Niedawne postępy w sztucznej inteligencji (AI) wspierają wysiłki na rzecz zrozumienia przeszłości.
Ithaca, model uczenia maszynowego stworzony przez badaczy sztucznej inteligencji w DeepMind, może odgadywać brakujące słowa oraz lokalizację i datę języka pisanego, zgodnie z nowym artykułem. Wysiłek ten może pomóc historykom rozszyfrować starożytne rękopisy.
„Ithaca jest głęboką siecią neuronową i jako taka jest niesamowicie zdolna do znajdowania ukrytych wzorców w ogromnych ilościach danych”, powiedziała w e-mailu Lifewire historyk Thea Sommerschield, współautorka najnowszego artykułu. wywiad. „Takie wzorce mogą być tekstowe (gramatyczne, składniowe lub powiązane z powtarzającą się 'formułą' w wielu tekstach) lub kontekstowe (pewne słowa pojawiające się konsekwentnie w pewnych gatunkach tekstów: np. dekret polityczny z klasycznych Aten wspominający słowa 'sojusz, rada, zgromadzenie…').”
Odkrywanie przeszłości
Ithaca to pierwsza głęboka sieć neuronowa, która może przywrócić brakujący tekst uszkodzonych napisów, zidentyfikować ich pierwotną lokalizację i pomóc ustalić datę ich utworzenia, powiedział Sommerschield.
Itaka pochodzi od greckiej wyspy w Odysei Homera. Naukowcy odkryli, że Itaka osiąga 62% dokładność w przywracaniu uszkodzonych tekstów, 71% dokładność w identyfikowaniu ich oryginalnej lokalizacji i może datować teksty w ciągu 30 lat od daty ich pochodzenia.
Pomoce wizualizacyjne firmy Ithaca mają na celu ułatwienie naukowcom interpretacji wyników. Autorzy artykułu napisali, że historycy osiągnęli 25% dokładność, pracując samodzielnie nad odtworzeniem starożytnych tekstów. Jednak wydajność historyka wzrasta do 72% podczas korzystania z Itaki, przewyższając wydajność modelu i pokazując potencjał współpracy człowiek-maszyna.
„Ithaca oferuje możliwe do zinterpretowania wyniki, pokazując rosnące znaczenie współpracy między ludzkimi ekspertami i uczeniem maszynowym oraz pokazuje, w jaki sposób dopasowanie ludzkich ekspertów z architekturami głębokiego uczenia się w celu wspólnego rozwiązywania zadań może przewyższyć indywidualną (niewspomaganą) wydajność zarówno ludzi, jak i model na tych samych zadaniach”- powiedział Sommerschield Lifewire.
Na przykład historycy obecnie nie zgadzają się co do daty serii ważnych ateńskich dekretów wydanych w czasie, gdy żyły godne uwagi postacie, takie jak Sokrates i Perykles, napisał Sommerschield w poście na blogu. Od dawna uważano, że dekrety zostały napisane przed rokiem 446/445 p.n.e., chociaż nowe dowody sugerują datę 420 lat p.n.e. „Chociaż może się to wydawać niewielką różnicą, dekrety te mają fundamentalne znaczenie dla naszego zrozumienia historii politycznej klasycznych Aten” – napisała
Najbliższym dziełem Itaki jest poprzednie narzędzie do uczenia maszynowego o nazwie Pythia, które Sommerschield i jej współpracownicy wydali w 2019 roku. Pythia była pierwszym modelem przywracania starożytnych tekstów wykorzystującym głębokie sieci neuronowe.
„Dzisiaj Ithaca jest pierwszym modelem, który całościowo zajmuje się trzema głównymi zadaniami w przepływie pracy epigrafa”, powiedział Sommerschield w e-mailu. „Nie tylko rozwija poprzedni, najnowocześniejszy zestaw Pythii, ale także wykorzystuje głębokie uczenie do atrybucji geograficznej i chronologicznej po raz pierwszy i na niespotykaną dotąd skalę.”
AI do pomocy historykom
AI jest przydatna do uzupełniania brakujących danych, takich jak lokalizacja i data tekstu, ponieważ dobrze uczy się bardzo złożonych wzorców poprzez analizę danych, powiedział Lifewire Brad Quinton, dyrektor generalny firmy AI Singulos Research.
„Korzystając z technik uczenia maszynowego, sztuczna inteligencja może przejrzeć dużą liczbę „znanych dobrych” przykładów, aby znaleźć wzorce między np. danym tekstem a jego datą i lokalizacją” – dodał Quinton. „Często te wzorce są tak złożone, że nie byłyby oczywiste dla ludzkiego eksperta”.
Przewidywanie brakujących danych to typowe zadanie sztucznej inteligencji opartej na uczeniu maszynowym. Na przykład GPT-3 z OpenAI może przewidzieć brakujące słowa w zdaniu lub nawet brakujące zdania w akapicie. Wiele systemów przetwarzania obrazu opartych na sztucznej inteligencji zostało wykorzystanych do przywrócenia wideo i obrazów poprzez inteligentne przewidywanie, co zostało utracone z oryginału.
„Koncepcyjnie badacze mogliby użyć podobnych technik, aby określić datę i pochodzenie sztuki lub narzędzi lub innych historycznych artefaktów stworzonych przez człowieka, w przypadku gdy istnieje oczekiwanie zmiany w podstawowym stylu i technice w czasie oraz w zależności od lokalizacji pochodzenie” - powiedział Quinton.