CASLIN - Souborný katalog ČR jako
zdroj pro sdílenou katalogizaci 1. Úvod Národní knihovna ČR zpřístupnila na Internetu v červnu 1995 CASLIN – Souborný katalog ČR (dále jen souborný katalog) v ověřovacím provozu jako bázi KZK – Katalog zahraničních knih. To byl jeden z prvních nejdůležitějších kroků na cestě ke sdílené katalogizaci s využitím národního souborného katalogu. Počátkem roku 2000 dal správce souborného katalogu uživatelům k dispozici takové softwarové prostředí, které umožňuje v plné míře naplnit základní záměr citovaný již v prvních koncepčních materiálech souborného katalogu: ”Cílovým principem budování souborného katalogu CASLIN je sdílená katalogizace on-line.”
2. Nezbytnost vývoje vlastního softwaru Souborný katalog byl do konce roku 1999 provozován v systému ALEPH, který však neumožňoval provádět import záznamů s kontrolou na duplicity dle potřeb souborného katalogu a dále nedovoloval zásahy do záznamů v bázi jinými než vlastními prostředky. Další modifikace pomocí programů bylo nutné provádět mimo bázi. Správce souborného katalogu používá externě vytvořený program pro řízený import s kontrolou duplicit. Toto řešení však vyžadovalo aktivaci procedury kontroly duplicit mimo bázi v systému ALEPH, a tudíž bylo možné zpracovávat pouze data získaná off-line. Sdílená katalogizace on-line však předpokládá primární katalogizaci v bázi souborného katalogu, a tudíž vstup účastníka přímo do báze souborného katalogu. Při různých příležitostech bylo často konstatováno, že právě zajištění sdílené katalogizace pro knihovny v ČR je hlavním důvodem změny systému pro souborný katalog. Mnohem méně se však hovořilo o tom, že vývoj vlastních aplikací pro provoz a správu souborného katalogu v systému ORACLE je pro správce nezbytný z důvodu zásadní racionalizace zpracování a celkové správy dat. Nový software pro souborný katalog přinesl následující zlepšení:
3. Provoz souborného katalogu v systému ALEPH Pro možnost srovnání je třeba alespoň stručně popsat způsob zpracování dat pro souborný katalog v systému ALEPH. Účastnící souborného katalogu zasílají data na ftp server nebo na disketě klasickou poštou. Kvalitativní analýza dat spočívala v ruční kontrole struktury a obsahu dat u každé dodané dávky. Pokud se jedná o účastníka, který již dodává data pravidelně, byla prováděna pouze namátková kontrola u každé nové dávky dat. Záznamy všech nových účastníků jsou prověřovány velmi pečlivě v několika kolech, kdy dochází k aktivní komunikaci písemné i telefonické a osobní mezi správcem souborného katalogu a účastníkem, který má zájem o dodávání svých záznamů do souborného katalogu. Výsledek kvalitativní analýzy správce písemně oznámí účastnické knihovně. Pokud byla data v pořádku, přesunul správce soubor dat do jiného adresáře na lokálním PC a přistoupil k jejich konverzi. Po skončení konverze byly dávky záznamů jednotlivých účastníků, které tvořily samostatné soubory, přesunuty pomocí ftp z adresáře na lokálním PC na server, kde správce pokračoval v jejich zpracování. Přidělil záznamům tzv.logické báze, které umožní rozlišení záznamů českých a zahraničních dokumentů, a kvalitativní váhu, která umožní rozlišení záznamů dle jejich kvality. Řízený import dat s kontrolou duplicit do souborného katalogu s využitím externího programu trval nejméně osm hodin a pokud se vyskytly komplikace i déle. Přitom nezáleželo na velikosti jedné dávky dat, protože program ”čte” celou bázi, ale záleželo na velikosti báze, která pochopitelně stále roste (viz Příloha 1). Z výše uvedeného vyplývá, že zpracování dávky dat jedné knihovny (bez ohledu na to, zda obsahovala 100 či 10 000 záznamů) trvalo dva pracovní dny. Během zpracování byl správce nucen použít sedm pomocných programů. S rostoucím počtem záznamů v souborném katalogu probíhal vlastní import jednotlivých dávek stále pomaleji. Racionalizace správy souborného katalogu a tudíž i značné zrychlení importu dat bylo vyřešeno využitím vlastních aplikací pro souborný katalog v systému ORACLE.
4. Vývoj aplikací v systému ORACLE Jak bylo již uvedeno, nutnost zásadního zkvalitnění správy souborného katalogu a potřeba dalšího rozvoje služeb pro uživatele i knihovníky vedla k rozhodnutí vývoje vlastních aplikací pro správu i provoz souborného katalogu s využitím databázového systému ORACLE. Veškeré služby jsou realizovány prostřednictvím SQL Serveru ORACLE a WebServeru ORACLE, a to při zachování všech současných standardů pro dodavatele a příjemce dat (navíc jsou přijímána data využívající UNICODE UTF 8). Od března 1998 probíhá vývoj aplikací pro provoz souborného katalogu v systému ORACLE. V září 1999 byla dána k testování omezenému okruhu odborníků beta verze základní aplikace souborného katalogu pro tištěné monografie. Bylo testováno:
Začátkem listopadu 1999 po instruktážní schůzce získali přístup do souborného katalogu v systému ORACLE všichni členové Pracovní skupiny pro Souborný katalog ČR. Pro účely testování bylo přiděleno celkem 37 přístupových hesel. Připomínky bylo (a stále je) možné zasílat e-mailem ze všech obrazovek souborného katalogu. Na počátku testování byla identifikována chyba v ukládání dat, kterou se ještě během testovacího období podařilo odstranit. Další připomínky a dotazy se týkaly především:
Správce souborného katalogu nemohl vyhovět žádostem o prodloužení testovacího období a k 31.12.1999 bylo testování ukončeno. Na každé obrazovce však zůstala aktivní ikona Připomínky, kam je možné uvést své dotazy a připomínky, a obracet se tak přímo na správce souborného katalogu. Účastníci testování velmi kladně hodnotili především uživatelskou přívětivost souborného katalogu a jednoduchou možnost přebírání záznamů a jejich importu do vlastních lokálních katalogů.
5. Zpracování dat pro souborný katalog v systému ORACLE V lednu 2000 byla zahájena správa a provoz souborného katalogu s využitím vlastního vyvinutého softwaru (byly zpřístupněny záznamy tištěných monografií). Došlo ke značné automatizaci všech činností spojených se správou báze souborného katalogu včetně analýzy vstupních dat, a to s maximálním využitím k tomu účelu dosud vytvořených softwarových prostředků. Zpracování záznamů probíhá zcela automaticky:
Účastník umístí svá data v přiděleném prostoru na ftp serveru (pokud je dodá na disketě, přesune je na ftp server správce). Program v pravidelných intervalech kontroluje, zda na ftp server nepřibyla nová data. Stáhne je a dle názvové konvence zjistí jejich vlastníka, v jakém jsou formátu a jaká byla použita znaková sada. Všechny nové i editované záznamy jsou před importem do souborného katalogu testovány. Součástí automatické kontroly je:
Pozn.: V průběhu testování záznamů na duplicitu v aplikacích systému Oracle se každý záznam hned po porovnání naimportuje do báze souborného katalogu a porovnává se s každým dalším záznamem dané dávky, dochází tudíž ke kontrole také vnitřní duplicity vstupní dávky dat. Informace o nevyhovujících záznamech jsou prostřednictvím e-mailu jako statistika s příslušným komentářem zaslány zpět dodávající knihovně k opravě. Celý proces zpracování záznamů probíhá stokrát rychleji a s lepší kvalitou než v ALEPHU (trvá cca 10 minut). Správce má možnost spustit jej jako celek, takže jednotlivé kroky proběhnou automaticky v návaznosti na sebe, nebo po jednotlivých krocích tak, že má možnost kontroly výstupů z každého kroku. V obou variantách správce může nastavit datum a čas spuštění celého procesu nebo kroků.
6. Sdílená katalogizace Základním předpokladem kvalitního zdroje pro sdílenou katalogizaci je kromě technologických nástrojů jeho aktuálnost. Vývojem vlastního softwaru pro souborný katalog vytvořil správce kvalitní technické podmínky k zásadnímu zlepšení aktuálnosti souborného katalogu. V zásadě je možné se s vybranými aktivními účastníky domluvit, aby každý den ke konci pracovní doby zaslali na ftp server souborného katalogu záznamy toho dne zpracovaných dokumentů, které správce během noci naimportuje. Od ledna 2000 mají účastníci souborného katalogu možnost stahovat vybrané záznamy (copy cataloguing) nebo využít možnosti katalogizace přímo v bázi souborného katalogu s následným kopírováním záznamu ve svém lokálním katalogu (shared cataloguing). Copy cataloguing Uživatel má možnost stahování jednotlivých záznamů nebo dávek záznamů ve zvoleném formátu a znakovém repertoáru, který zadá v menu. Při využití obsahu pole 001 může uživatel vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším (staženým ze souborného katalogu). Shared cataloguing Při tvorbě nového záznamu v souborném katalogu využije katalogizátor dané knihovny nabídnutý vstupní formulář (JAVA applet), který neobsahuje nepovolená pole. Povinná pole dle instrukcí pro souborný katalog jsou rozepsána, avšak katalogizátor má možnost další zvolená pole, která nejsou jednotlivě uvedena ve formuláři, zahrnout do verze vstupního formuláře. Tuto vlastní verzi si pojmenuje, uloží do svého prostoru a kdykoliv znovu použije. Editace záznamu Pro editaci je k dispozici vstupní formulář, který zobrazí kompletní obsah editovaného záznamu. Při editaci má uživatel možnost vložit do svého záznamu identifikační číslo (tag 001), a tím může vlastními prostředky docílit přepsání původního záznamu ve své bázi kvalitnějším, který upravil v souborném katalogu. Použití tagu 001 umožní plně využít tuto službu také knihovnám, které jsou nuceny provádět konverzi formátu záznamů vlastními prostředky. Správce souborného katalogu připravil technické podmínky ke sdílení záznamů a bude dále usilovat o aktuálnost, kvalitu i intenzívní naplňování souborného katalogu. Cílem je, aby se souborný katalog stal skutečně žádaným a využívaným zdrojem pro sdílenou katalogizaci, což v tuto chvíli záleží také na aktivitě jeho účastníků z řad knihovníků. Pozn.: 7. Závěr Ačkoliv prozatím účastníci projevují zájem především o dávkové přebírání vybraných záznamů, je třeba si uvědomit, že s vývojem nového softwaru pro souborný katalog bylo nezbytné vytvořit také možnost katalogizace v bázi souborného katalogu s následným zkopírováním záznamu do vlastní lokální báze. Stejně jako ve světě i v České republice je cílem vytvářet katalogizační záznam jen jednou v souborném katalogu a jeho prostřednictvím jej dát k dispozici ostatním knihovnám. |