Wprowadzenie
Internet semantyczny oraz ustrukuryzowane, powiązane otwarte dane (Linked open data) oferują ogromny potencjał na polu wyszukiwania informacji oraz rozumienia znaczenia danych, informacji i treści przez komputery. Powiązane dane są bowiem czytelne maszynowo i umożliwiają tworzenie rozmaitych wizualizacji i grafów wiedzy.
Pokrótce mówiąc, wiązanie danych polega na połączeniu wspólnego ogniwa między informacjami. Ogniwem tym mogą być np. osoby, prace twórcze, wydarzenia czy miejsca. Jeśli dokument wskazuje na takie ogniwo, to może ono zostać połączone z rekordem w kontrolowanym słowniku, np. słowniku geograficznym online.
Pelagios Commons / Network
P elagios Commons to otwarta społeczność / sieć, która koncentruje się na łączeniu informacji o historycznych miejscach. Pelagios zajmuje się problemami związanymi z geografią historyczną oraz zarządzaniem otwartą informacją. Należy zaznaczyć, że Pelagios Commons było finansowane przez Fundację Mellona, ale projekt się skończył. Obecnie Pelagios Commons przeorganizowane zostało w Pelagios Network.
Należy zaznaczyć, że Pelagios w szczególności skupia się na antyku oraz rozwija konwencje i narzędzia na potrzeby publikowania powiązanych otwartych danych. Według Rainera Simona z Austrian Institute of Technology konwencje te obejmują:
- Miejsca (ang. places), określone za pomocą kontrolowanych słowników (tzw. gazeterów),
- Ślady (ang. traces), które odnoszą się do danych połączonych z miejscami.
Interesującą konwencją są ślady. Karl Grossner z World History Center University of Pittsburgh zauważa, że:
…śladem jest każda historyczna jednostka mająca ustawienie przestrzenno-czasowe [czyli] ludzie i grupy ludzi, zdarzenia o dowolnej złożoności oraz wszelkiego rodzaju artefakty…
Połączone ślady mogą być tworzone i edytowane w Recogito, a wyszukiwane i wizualizowane za pomocą Peripleo.
Recogito
O twartoźródłowe Recogito (w wersji 3.2) dostępne jest w repozytorium GitHub oraz jako darmowa usługa oferowana przez Pelagios. To proste w użyciu oprogramowanie wspiera zespołowe tworzenie semantycznych adnotacji opartych na lokalizacji, bowiem to właśnie lokalizacja umożliwia Recogito powiązanie i strukturyzowanie danych. Narzędzie ułatwia adnotowanie dokumentów tekstowych oraz obrazów i zaznaczenie miejsc w nich występujących. Miejsca są następnie wiązane ze swymi lokalizacjami za pomocą gazeterów.
Recogito ułatwia publikację wyników badań w postaci powiązanych otwartych danych, eksport danych do różnych formatów oraz sposobność skorzystania z danych w innych narzędziach cyfrowych i platformach.
Gazetery
Gazeter to sieciowa, geograficzna kartoteka kontrolowana. Recigito łączy dane w ramach Open Annotation Data Model, a do gazeterów z których korzysta należy zaliczyć m.in:
- Pleiades – lista lokalizacji świata antycznego,
- DARE – słownik miejsc Imperium Rzymskiego,
- Kima – słownik historycznych miejsc wymienionych w pismach hebrajskich,
- GeoNames – słownik stosowany na potrzeby obecnych lokalizacji.
Łączenie danych w Recogito
Łączenie danych w Recogito polega na dodaniu dokumentu do aplikacji, naniesieniu adnotacji oraz identyfikacji miejsca w celu przypisania lokalizacji w wybranym gazeterze.
Gromadzenie dokumentów
R ecogito obsługuje pliki txt, TEI, jpg, tiff, png, csv, a także obiekty IIIF (poprzez podanie adresu manifestu). W celach testowych wykorzystano plik tekstowy, który stanowi fragment (s. 5) dokumentu pt. Jedenasta rocznica rewolucji 29 listopada w Paryżu pod prezydencją Walentego Zwierkowskiego (który w ramach projektu POPC udostępniony został w Kujawsko-Pomorskiej Bibliotece Cyfrowej). Plik przesłano do Recogito w usłudze Pelagios. Następnie pobrano Mapę do pierwotnych dziejów Polski i Litwy (także z KPBC z projektu POPC) w formacie pdf, dokonano jego konwersji do formatu jpg i dodano do Recogito.
Adnotowanie i mapowanie miejsc
W celu dodania adnotacji do dokumentu tekstowego należy otworzyć wybrany dokument w widoku adnotacji oraz zaznaczyć konkretne słowo w tekście. Recogito umożliwia dodanie komentarza lub słów kluczowych, a także określenia, czy jest to miejsce, osoba bądź wydarzenie. Można także zdefiniować relacje pomiędzy terminami w tekście.
Z plikiem graficznym, w naszym przypadku skanem mapy, sytuacja wygląda podobnie. Zestaw funkcji różni się w zależności czy pracujemy z plikiem tekstowym czy obrazem. W tym przypadku otrzymujemy więcej opcji zaznaczania, takich jak punkt lub połączony boks.
C celem przypisania lokalizacji w słowniku kontrolowanym do miejsca wymienionego w tekście bądź obrazie należy zaznaczyć słowo lub fragment obrazu, następnie określić je jako miejsce oraz przypisać do konkretnej lokalizacji w wybranym gazeterze (niektóre miejsca mogą znajdować się w różnych gazeterach). W tym przypadku skorzystano z gazetera Kima (który w pewnym stopniu może zainteresować badaczy średniowiecza).
Publikacja oraz współpraca
W widoku eksportu możemy eksportować swoje dane do rozmaitych formatów, które wspierają współdziałanie systemów lub uczenie maszynowe. Należą do nich CSV, RDF, GeoJSON lub format IOB. Można także udostępnieniać i adnotować dokumenty w grupie. Aby udostepnić dokument innym osobom, należy przejść do ustawień dokumentu, uzupełnić metadane, a następnie wybrać opcje udostępniania.
Otwórz plik tekstowy w Recogito
Peripleo
P eripleo to wersja beta, prototyp wyszukiwarki danych pochodzących z projektów Pelagios. Peripleo umożliwia wyszukiwanie miejsc, obiektów, okresów czasu, osób oraz zestawów danych (przy zastosowaniu operatorów logicznych) oraz połączonych z nimi informacji. Wyszukiwarka pozwala na zawężanie wyników za pomocą takich flitów jak histogram czasu, źródło czy typ elementu. Obecnie najwięcej danych dotyczy starożytności, ale w przyszłości w Peripleo mogą pojawić się dane pochodzące z późniejszych okresów.
Podsumowanie
K ogo może zainteresować Recigito oraz Peripleo? Niewątpliwie niektórych humanistów cyfrowych, historyków, badaczy antycznej literatury, archeologów zajmujących się inskrypcjami lub monetami, naukowców interesujących się klasyczną Grecją i starożytnym Rzymem. Co ciekawe, oprogramowanie Recogito można zastosować do publikacji naukowych edycji cyfrowych ze względu na możliwość korzystania z narzędzi TEI (co też jest celem specjalnej gupy roboczej).
Istotny z puntu widzenia omawianego tematu wydaje się termin „traces”, który stosowany jest również w projekcie World-Historical Gazetteer. Ślady oparte na rekomendacjach W3C Web Annotation Data Model mają postać połaczonych śladów (ang. Linked Traces). Umożliwiają one łączenie lokalizacji także z informacjami o osobach bądź wydarzeniach. Co ciekawe WHG będzie posiadał interfejs z funkcjami podobnymi do Peripleo ale jednak rozszerzonymi o potencjał połączonych śladów.
Połączone otwarte dane to niezwykle praktyczna idea. Łączenie danych wpływa na poprawę jakości i efektywność wyszukiwania informacji. Umożliwia spojrzenie na dane z różnych perspektyw i budowanie rozmaitych relacji i opowieści. Niemniej jednak za Rainerem Simonem można powiedzieć, że 'połączone otwarte dane wymagają dużego nakładu pracy ludzkiej, aby później były czytelne dla maszyn’. Na szczęście Recogito to użyteczne narzędzie, dzięki któremu powiązanie danych nie sprawia trudności.
Pomocne zasoby
Do podstawowych punktów pomocy oraz kanałów informacyjnych dotyczących narzędzi opracowanych przez Pelagios należy zaliczyć:
- Samouczek Recogito: https://recogito.pelagios.org/help/tutorial
- Forum Recogito: http://commons.pelagios.org/groups/recogito-users/
- Często zadawane pytania (FAQ): https://recogito.pelagios.org/help/faq
- Samouczek Peripleo: https://peripleo.pelagios.org/help/introduction
- Blog Pelagios: https://medium.com/pelagios
Bibliografia
- 10 Minute Tutorial, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://recogito.pelagios.org/help/tutorial
- About Recogito, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://recogito.pelagios.org/help/about
- Castro Antonio Rojas, Recogito-TEI Working Group: from semantic annotation to minimal digital editions, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://medium.com/pelagios/recogito-tei-working-group-from-semantic-annotation-to-minimal-digital-editions-4f578334968e
- del Rio Gimena, De León Romina, Hernández Nidia, Isaksen Leif, Getting to Grips with Semantic and Geo-annotation using Recogito, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://zenodo.org/record/2530206
- Grossner Karl, Linked Traces, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: http://whgazetteer.org/2019/03/26/linked-traces/
- Palladino Chiara, Linked Open Data to navigate the Past: using Peripleo in Class, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://medium.com/pelagios/linked-open-data-to-navigate-the-past-using-peripleo-in-class-4286b3089bf3
- Simon Rainer, Places and Traces: Space and Time in Pelagios and the Linked Places Data Model, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://www.youtube.com/watch?v=kg5ZNtuSDqw
- The Linked Traces annotation format, [online] [Dostęp: 24.06.2019] Dostępny w World Wide Web: https://github.com/LinkedPasts/linked-traces-format
il. wprowadzenie: Mapa do pierwotnych dziejów Polski i Litwy