Humanistyka Cyfrowa

Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

: Marek Zielinski

Standardy metadanych dla archiwów: płaskie czy hierarchiczne? (Cz. 2)

Część 2

Wszystkie nowoczesne standardy zapisu informacji używają jednego języka zapisu, XML. Jest to język uniwersalny, prosty i łatwy do opanowania, a jednoczesnie ma ogromną moc ekspresji. Adres Instytutu możemy w XML zapisac płasko:

<adres>180 Second Avenue, New York, NY</adres>

albo hierarchicznie:

<galaktyka nazwa="Droga Mleczna">
   <gwiazda nazwa="Sol">
     <planeta nazwa="Mars"/>
     <planeta nazwa="Ziemia">
       <kontynent nazwa="Ameryka Północna">
         <panstwo nazwa="USA">
           <stan nazwa="Nowy Jork"> [...] itp.
           </stan>
         </panstwo>
       </kontynent>
     </planeta>
   </gwiazda>
</galaktyka>

EAD jest standardem (wyrażanym w XML) opracowanym dla archiwów i jest bardzo typowym przykładem opisu hierarchicznego. Jest odbiciem typowej organizacji archiwum, gdzie kolekcja (zespół archiwalny, fonds) może byc podzielona na pod-zespoły (subfonds), te z kolei na serie, podserie, grupy, podgrupy itp. Często organizacja taka nie jest sprawą wyboru, gdy na przykłład oryginalny twórca danej kolekcji tak ją właśnie uporządkował. Zasada szacunku dla oryginalnego twórcy kolekcji (respect de fonds) wymaga pozostawienia w miarę możności oryginalnej organizacji.

Czytaj więcej: Standardy metadanych dla archiwów: płaskie czy hierarchiczne? (Cz. 2)

: Iwona Korga

Metropolitan Library Council

Instytut Piłsudskiego od kilku lat współpracuje z wielu lat z Metropolitan Library Council (METRO, www.metro.org), organizacją skupiającą 250 bibliotek zatrudniających 8000 tysięcy bibliotekarzy i archiwistów w Nowym Jorku i okolicy. Celem działania METRO jest szeroko rozumiana pomoc w dziedzinie wsparcia technologicznego, szkolenia kadr, pozyskiwania grantów oraz stworzenie możliwości wzajemnego poznania się i współdziałania społeczności skupiającej specjalistów z zakresu informacji naukowej.

METRO jest organizacją sponsorowaną przez stan Nowy Jork, każdego roku w swych przestronnych pomieszczeniach organizuje ponad 70 różnego rodzaju szkoleń z zakresu digitalizacji, opracowania zbiorów i najnowszych trendów w dziedzinie informacji naukowej.

Pracownicy i wolontariusze Instytutu wielokrotnie uczestniczyli w szkoleniach, nawiązali kontakty z pracownikami innych a działających podobnie instytucji. Szczególnie twórcze było spotkanie, które odbyło się 3 kwietnia 2012 pt. Basic introduction to Encoded Archival Description EAD, które znacznie ułatwiło zrozumienie tego ważnego dla archiwistów standardu. Jesienią 2012 planujemy udział w kolejnych zajęciach dotyczących ważnego programu z grupy Open Source - Archivist’s Toolkit, który od niedawna stosujemy w opracowaniu zbiorów archiwalnych.

Wsparcie jakim służy METRO jest bardzo ważne dla działalności Instytutu, daje możliwość śledzenia postępu technologicznego, edukacji oraz poprzez działanie w dużej grupie możliwość realnego wpływu na ważne dla społeczności biblioteczno-archiwalnej rozporządzenia i uchwały stanowe.

Iwona Korga, 7 sierpnia 2012

Może Cię też zainteresować:

: Marek Zielinski

Standardy metadanych dla archiwów: płaskie czy hierarchiczne? (Cz. 1)

Część 1

Przy planowaniu procedur i etapów pracy projektu digitalizacji zasobów archiwalnych Instytutu zastanawialiśmy się nad tym, jakiego standardu użyć przy opisie digitalizowanych dokumentów. Po wykonaniu skanu czyli zapisu obrazu dokumentu, niezbędnym jest jego opisanie tak, aby możliwe było znalezienie interesującej czytelnika informacji. Idealnie byłoby dokonać transkrypcji całości materiału, ale przy dużej ilości ręcznie pisanych dokumentów były to tylko marzenia. Proces znajdywania i organizowania informacji o tekście, zdjęciu itp. czyli tak zwanych metadanych (danych o danych) oraz zapisywania ich w odpowiedniej bazie danych jest najważniejszyma (i najbardziej czasochłonnym) etapem digitalzacji.

Jest wiele schematów i standardów zapisu i transportu metadanych, więcej niż można łatwo ogarnąć ciekawie brzmiących skrótów: DC, EAD, MARC, MODS, TEI, AACR2, CCO, CDWA, DACS, FOAF, ISAD(G), METS, OAI-PMH, OAIS, OWL, POWDER, PREMIS, RDA, RDF, SWORD itp. Nawet ograniczając się do standartów opisu metadanych zawartości dokumentów, mieliśmy do wyboru DC, EAD, MARC i TEI. Przy testach pojawił się problem hierarchizacji informacji, który w zasadzie ciągle jest z nami, mimo prób jego oswojenia.

Czytaj więcej: Standardy metadanych dla archiwów: płaskie czy hierarchiczne? (Cz. 1)

: Marek Zielinski

Europejski Portal Archiwalny

Otwarty niedawno Europejski Portal Archiwów, Archives Portal Europe (APE), zrzesza 63 archiwów z 15 krajów europejskich. Archiwa wnoszą swój wkład w postaci elektronicznie zakodowanych pomocy archiwalnych. Zaletą systemu jest wspólna wyszukiwarka, która pozwala na przeszukiwanie pomocy w całym zespolonym zasobie. Przydatna jest też przeglądarka po jednostkach archiwalnych, pozwalająca na oglądanie sąsiednich zapisów tego samego poziomu, oraz przesuwanie się z poziomu na poziom.

Intrygujące jest użycie standardu EAD do zapisu informacji. EAD, w połączeniu z ISAD(G) jest bardzo elastycznym systemem kodowania informacji archiwalnych, ale na skutek tej elastyczności występuje nadmierna różnorodność w schemacie zapisu. Prawie każdą informację można zapisać na kilka sposobów, co w kapitalny sposób utrudnia interoperatywność. APE opracował usztywnioną wersję EAD oraz przygotował zestaw narzędzi do konwersji różnych ‘smaków’ EAD w jednolity system, który może byc użyty do wyświetlania informacji i do jej łączenia. Takie narzędzie i standard może się stać podstawą interoperacyjnej wersji EAD.

Głębokość zasięgu APE kończy się na opisie zasobów, który jest tak wyczerpujący jakim go stworzyły archiwa, ale nie daje dostępu do dokumentów. Następnym etapem pracy badacza jest wizyta w odnalezionym archiwum lub podróż po róznych archiwach i studiowanie oryginałow lub mikrofilmów. Polska jest reprezentowana w APE przez 10 archiwów, które umieściły tam część swoich katalogów.

Marek Zieliński, 30 czerwca 2012

Może Cię też zainteresować

: Marek Zielinski

Chmura i Powstania Śląskie

Crowdsourcing z użyciem Google Docs

Fragment mapy z okresu Powstań śląskich z archiwów Instutytu Józefa Piłsudskiego, zespół 8 jedn. 164.

Przy pracy nad kolekcją “Powstania Śląskie” w archiwum Instytutu pojawił się dylemat. Archiwa są już zmikrofilmowane a mikrofilmy zeskanowane, ale z ponad 800 jednostek (teczek) udostępnione zostało tylko 50. Wynika to z braku metadanych, szczególnie danych o powstańcach, którzy walczyli w trzech Powstaniach Śląskich w latach 1919-1921. Brak finansowania powodował odsuwanie dokończenia projektu, gdyż nie umieliśmy wykorzystać pomocy wolontariuszy pracujących w domu. Co prawda istniały podobne projekty crowdsourcing, ale były one oparte na specjalnie napisanym oprogramowaniu i sporym finansowaniu projektu.

Wpadliśmy wtedy na pomysł, aby użyć gotowego, publicznie dostępnego systemu. Google Docs (teraz Google Drive) wydawał się być użyteczny dla tego projektu. Wymagało to dopasowania naszych wymagań do możliwości systemu, i narażało nas na wpadkę jeśliby Google w sposób istotny zmienił format dokumentów (co już się raz zdarzyło). Ale postanowiliśmy zaryzykować.

Czytaj więcej: Chmura i Powstania Śląskie

: Tomasz Kalata

Crowdsourcing

Crowdsourcing jest relatywnie nowym pomysłem, polegającym na powierzeniu jakiegoś zadania, tradycyjnie wykonywanego przez pracowników organizacji, grupie osób czy społeczności (crowd = tłum) poza tą organizacją. Różnica w stosunku do techniki outsourcing polega na tym, że zadanie powierzone jest nieznanej grupie jako publiczny apel, a nie jakiemuś konkretnemu ciału. Crowdsourcing, dzięki technologii Web. 2.0, uważany jest za narzędzie z dużymi perspektywami tak w przypadku komercyjnych organizacji jak i non-profit, jakimi są biblioteki i archiwa. Najbardziej znanym przykładem wykorzystania techniki crowdsourcing jest Wikipedia, czyli cyfrowa, powszechnie dostępna encyklopedia, tworzona przez internetowych wolontariuszy. Projekt ten w bardzo krótkim czasie i przy minimalnym koszcie doprowadził do powstania blisko 4 milionów artykułów w przypadku anlogjęzycznej wersji!

Biblioteki i archiwa wydają się być naturalnie predysponowane do wykorzystania metody crowdsourcing. Ograniczone i często skromne budżety, jak i niewielka ilość pracowników często stają na przeszkodzie w wykonaniu projektów, zwłaszcza tych związanych z digitalizacją. Z drugiej strony biblioteki i archiwa cieszą się dużym zaufaniem i poparciem publiki, które to może zaowocować zaangażowaniem i silną motywacją wolontariuszy. Jak sugeruje Ross Holley w swoim artykule “Crowdsourcing: How and Why Should Libraries Do it?”, satysfakcja z wykonywania pracy, która przynosi dobro dla ogółu jest ważnym motorem sukcesu organizacji kulturalnych podejmujących ideę crowdsourcing.

Czytaj więcej: Crowdsourcing

: Marek Zielinski

Międzynarodowy Dzień Archiwów - 9 czerwca

Od czterech lat w dniu 9 czerwca obchodzony jest Międzynarodowy Dzień Archiwów, proklamowany w roku 2005 przez Międzynarodową Radę Archiwów (ICA). Archiwa i ich zasoby stanowią podstawę tożsamości społeczeństw i ich praw obywatelskich. Dzień Archiwów ma służyć poniesieniu w społeczeństwach wiedzy o archiwach, a także przekonaniu decydentow o pożytkach płynących z właściwego zabezpieczania i organizowania dokumentacji. Propagownie celów i zadań instytucji archiwalnych jak i dostarczenie informacji o ich zasobach jest także częścią obchodów tego dnia.

W tym roku Dzień Archiwów był obchodzony w wielu krajach, w postaci wystaw, konferencji i innych form promocji archiwów. Międzynarodowa Rada Archiwów jest ciałem zrzeszająctym archiwa, organizacje państwowe i profesjonalistów z dziedziny archiwistyki z całego świata. W tym roku odbędzie się organizowany co cztery lata Kongres, tym razem pod hasłem Klimat na zmiany (Brisbane, 20-24 sierpnia 2012)

Marek Zieliński, 9 czerwca 2012

Może Cię też zainteresować: