Já teda nejsem
zkušený IS/IT profík. Ale s počítači pracuju a bavím se od začátku devadesátých let, takže se považuju za pokročilého uživatele.
Znovu jsem testoval tu kontrolu u Vademeca. Včera to v Litoměřicích i v Opavě bylo mezi 2-5 vteřinami (jednu chvíli Litoměřice úplně spadly, večer Opava pro změnu chvíli prováděla jakousi aktualizaci). Dnes kontrola pro oba archivy trvala o něco déle, ale i tak je to do deseti vteřin. To se dá vydržet - není to tak, že by každý další sken při procházení daného dokumentu vyžadoval novou a novou kontrolu (to bych asi nadával taky a hodně hlasitě). Pokud by mi to snad ale mělo běžet v řádu minut nebo "nekonečně", tak bych asi napsal přímo správcům těch archivů, v čem může být chyba.
Aby bylo jasno - nejsem nijak spojen s žádným archivem a nemám zájem je obhajovat - snažím se je hodnotit pokud možno objektivně. Třeba podle počtu nově zveřejněných matričních přírůstků, což je pro mne momentálně to nejdůležitější kritérium. K čemu rychlá a uživatelsky příjemná aplikace, když v ní nebudou dokumenty, které v ní očekávám?
Ale chápu, že někomu ta kontrola může vadit (zvlášť, když dřív nebyla a většina ostatních archivů nic podobného nemá - nebo to neprobíhá takto viditelně). Mě třeba v archivu Hl. města Prahy taky dost irituje, když něco hledám v matrice a po rychlém projití cca 50 stránek to na mne vyplivne hlášku "Příliš mnoho požadavků" a pět minut mám smůlu. Procházím to ručně, žádný skript - a přesto mne vypnou.
Ono je to ale i o tom, že čím univerzálnější aplikace (a těmi Vademecum a hradecký ARON jsou), tím je komplikovanější, obtížnější k odladění (tj. náchylná k chybám) - a také
k zahlcení. MZA Brno má v jedné aplikaci matriky (jednoduché, přehledné a rychlé), ve druhé sčítací operáty (také rychlé), v ARONu pak pozemkové knihy a katastry (opět rychlé, s hradeckým ARONem nesrovnatelné), v další aplikaci urbáře atd. Na správu to je asi náročné, ale spolu s dostatečně výkonným hardware tam asi nehrozí zahlcení uživateli a hlavně těmi boty. Aspoň zatím...
Nemusí to nutně být o lepších programátorech. Spíš o promyšlené koncepci. Kdo ale před pěti lety věděl, že webové stránky budou prolézány nějakými "boty"? Já určitě ne.

Ale že aplikace, do které se kromě digitalizátů zadává i další kvantum informací o archivních položkách všeho druhu, má nějaký datový strop (či požadavek na hardware), to by ti IS/IT správci v archivech asi vědět měli.
Mimochodem, ti
boti či roboti - to jsou programy, které procházejí weby (tedy i archivy) za účelem tréninku čtení a získávání informací pro AI. Tedy ne, že by se AI utrhla ze řetězu a vydávala se tam sama. Za tím jsou firmy, které se v rámci konkurence snaží ten svůj model AI co nejvíce zdokonalit, aby s ním pak získaly co nejvíce placených uživatelů. A takovéto hromadné automatizované návštěvy jsou na softvarově komplikované aplikace typu Vademecum a ARON (který navíc běží už od začátku na poddimenzovaném HW) mor. S tou kontrolou se bohužel "svezou" i celkem nevinné uživatelské skripty. Pro uživatele je to potvrzování otravné, ale pořád lepší, než kdyby se jim jeden sken načítal minutu (nebo vůbec), protože je to zahlcené.
Druhá věc je možnost stahování celých matrik. Snad každý náš archiv má ve svých pravidlech zmínku o hromadném stahování dat (tj. že není přípustné). A to se týká stahování jednotlivách skenů! Celou matriku umožňuje stáhnout myslím pouze SOA Hradec Králové. Jinak nikdo. A MZA (které jsem zde jinak dost chválil) neumožňuje v jejich základní navigaci stáhnout ani jednotlivou stránku. To přidává až jistý uživatelský doplněk.
Ano, ono se to stahování (a i to
hromadné)
dá obejít skriptem. Jenomže to se archivům nelíbí a snaží se tomu zabránit. A ta kontrola u Vademeca je předpokládám projektovaná i pro tyto účely.
Řečeno slovy klasika "
Můžeme o tom vést spory, můžeme s tím nesouhlasit, ale to je asi tak všechno, co se s tím dá dělat..." Protože při použití netolerovaného skriptu obvykle následuje ban a při opakování či v případě většího rozsahu i něco horšího. Jak moc to (ne)koreluje s platnými zákony a nařízeními, to posoudit nedokážu. Ostatně, každý archiv si je stejně vykládá trochu jinak - někdy pro uživatele příznivěji (např. Opava nyní zpřístupňuje některé
indexové matriky vedené do roku 1949 včetně narozených), někde přísněji (což bylo to "proaktivní" skrytí již zpřístupněných operátů 1921 v MZA kolem roku 2020). Bohužel (někdy možná bohudík) to nadřízený orgán archivů neřeší.