Převodník odkazů MZA Acta Publica

Kdo byl v jakém archivu, a jaké jsou Vaše zkušenosti? Jak jste byli spokojeni?

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » ned led 31, 2021 16:25

greghouse píše:
zburget píše:nemám nic proti Javě - ale nutnost použití Java11 je dost nešťastná - pro normální uživatele se to hledá celkem dost blbě. Lepší by bylo použít Java8, od které se JRE hledá, stahuje a instaluje velice jednoduše.

Hledá se to blbě proto, že od verze 9 se JRE již nevydává a vydává se SE (Standard Edition). Stáhne-li si člověk tu, poběží to v pohodě.
Jj, já vím - a taky Oracle moc nechápu. Když člověk jde na stránky java.com - Download, tak se dozví, že "Recommended Version 8 Update 281". A i když pak klikne na "See all Java dowlonads", pořád je tem jen Java 8 :-(
Kolik "normálních" lidí, kteří jdou hledat Javu, půjde na Stránky Oracle -> Products -> Java? A i když pak někdo klikne na Dowload, tak se dostane na stránku, ve které se obyčejný člověk nemá šanci vyznat :-( Na java.com bylo jano a přehledno. Nechápu.
Možná by nebylo marné k odkazu na ten převodník přihodit i přímý odkaz na příslušný instalátor Javy.

zburget píše:Ideální by bylo to pak napsat v perlu, PHP nebo Pythonu a vrznout to někde na web…


Ideální by bylo, kdyby toto za nás dělal automaticky web MZA. Já nemám dostatek zkušeností na to, abych z toho dělal webovou službu v rozumném čase a nikdo tu nebude čekat měsíce, než se mi to možná podaří. Nabídl jsem, že to udělám s tím co umím, čili jestli se do toho chce pustit někdo jiný a udělat z toho webovou službu, může sobě a ostatním klidně posloužit.
O.K. - jako bych nic neřekl - tedy já o sobě říkám na rovinu, že to časově nedám. Tak to samozřejmě nemůžu chtít po někom jiném :-)

Zkuste popřemýšlet, jak do toho převodníku nacpat ty děravé matriky. Podklady zase nachystám - tady budu muset matriky projít asi ručně, ale to chci udělat stejně, abych mohl MZA hodit na hlavu ten bordel, co v tom mají…
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: Převodník odkazů MZA Acta Publica

Příspěvekod Ekharon » úte úno 02, 2021 17:52

Zdravím,

tak jsem otestoval převod odkazů na mém .ged souboru a mám několik málo připomínek/otázek.

1) Myslím, že by nebylo špatné nepřepisovat původní soubor, ale vytvořit nový s nějakým upraveným názvem. Stejně tak bych neměnil přímo převáděný text v režimu "TEXT", ale vypisoval jej do jiného místa (docela špatně se pak porovnájí provedené změny).

2) Nepřevedlo mi to všechny odkazy, ale jen nějaké. Nepřevedené odkazy jsou asi většinou uvnitř HTML elementů <a>, parametr "href". Myslím, že by se odkazy měly hledat reg. výrazem, který by je měl najít úplně všude. Není důvod takovéto odkazy vynechávat.

3 TEXT <p>smrt&nbsp; -&nbsp;<a style="font-size: medium;" href="http://actapublica.eu/matriky/brno/prohlizec/853/?strana=80">https://www.mza.cz/actapublica/matrika/detail/835?image=216000010-000253-003377-000000-012323-000000-00-B02179-00800.jp2</a></p>

3) Jsou někde dostupné zdrojové kódy? Pokud bych znal algoritmus převodu, mohu se někdy pokusit to přepsat třeba do zmiňovaného pythonu.

Předem moc díky za odpověď a také za vytvoření aplikace :-)
Ekharon
 
Příspěvky: 4
Registrován: čtv led 28, 2021 14:05

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » úte úno 02, 2021 18:37

Ekharon píše:1) Myslím, že by nebylo špatné nepřepisovat původní soubor, ale vytvořit nový s nějakým upraveným názvem. Stejně tak bych neměnil přímo převáděný text v režimu "TEXT", ale vypisoval jej do jiného místa (docela špatně se pak porovnájí provedené změny).

Není problém přidat možnost vybrat si mezi současnou a Vaší variantou.

Ekharon píše:2) Nepřevedlo mi to všechny odkazy, ale jen nějaké. Nepřevedené odkazy jsou asi většinou uvnitř HTML elementů <a>, parametr "href". Myslím, že by se odkazy měly hledat reg. výrazem, který by je měl najít úplně všude. Není důvod takovéto odkazy vynechávat.


Odkazy se hledají reg. výrazem, ale je v něm chyba, kterou se vynasnažím napravit. Vynechávat odkazy, které je možné převést, není záměr.

Ekharon píše:3) Jsou někde dostupné zdrojové kódy? Pokud bych znal algoritmus převodu, mohu se někdy pokusit to přepsat třeba do zmiňovaného pythonu.

Troufáte-li si ten převodník napsat v Pythonu, nemyslím si, že byste k tomu potřeboval můj zdrojový kód. Neděje se tam nic zásadního nebo inovativního.
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » úte úno 02, 2021 18:51

převodní algoritmus je poměrně jednoduchý. Každá matrika měla ve staré AP nějaké ID (to je to číslo v URL - ve vašem případě 853). V nové AP ma ID jiné - ve vašem případě je to 835.
Převod mezi těmi ID je v tabulce (originál je OpenDocument, v převodníku je přeuložený do csv)
A ke každému ID z nové verze AP je pak textový soubor, ve kterém jsou cesty ke konkrétnímu skenu - každé staré stránce odpovídá sekvenčně jeden řádek.
Jen teď ještě řeším jeden problém a to jsou matriky, které byly ve staré AP zveřejněny částečně. Vypadalo to tam tak, že místo některých snímků byly zobrazeny "monoskopy". V nové verzi AP ale v řadě snímků tyhle monoskopy nejsou a snímky navazují těsně za sebe. Takže bude potřeba vyrobit nějaký mechanismus, pomocí kterého se převodníku řekne, kde byly ty "díry v řadě".
Příklad - ve staré verzi byly snímky na stranách 1-62, 95-154, 178-215. A v nové verzi jdou stránky hezky popořadě 1-160. Pro vynechané snímky je místo v číselné řadě skenů. Takže nechť si někdo, kdo programuje převodník řekne, jak chce dodat informace o těch "dírách".
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » úte úno 02, 2021 18:56

Jen takový dotaz. Když tedy v těch některých matrikách existují "díry", které jsou rozsahem desítky stran a nová AP je má bez mezer, kam budou ty chybějící strany poté zařazeny? Protože ten prostor 9 snímků mezi současnými snímky dostatečný zjevně není.
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » úte úno 02, 2021 19:12

S tím se počítá - já myslím, že už mají naskenováno všechno, jen není všechno zveřejněno. V mém příkladu by po snímku č. 620 následoval snímek 950.

Koukněte třeba do matriky sig. 886, ID 11427
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » úte úno 02, 2021 19:21

Aha, už je mi to jasné. V podstatě číslo snímku je zejména u takových kusově zveřejňovaných matrik v podstatě nepodstatná informace, protože se během času stejně změní a podstatný je název souboru snímku, při kterých se s mezerama již počítá. Správně?
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » úte úno 02, 2021 19:41

Aktualizoval jsem aplikaci na verzi 1.1, ve které jsem zohlednil připomínky kolegy Ekharona.
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » úte úno 02, 2021 19:47

Já tedy jen upozorňuju, aby se zatím převodník nepoužíval na hromadné převody, dokud nebude vyřešen problém částečně zveřejněných matrik.
Pracuju na tom…

…a taky dokud nebude mít MZA opravené aspoň ty chyby, které už jednou opravené měli :-( Ty už jim začínám hlásit, ale jak rychle to budou schopní opravovat, to netuším. Včera dostali první várku, zatím nepřišla žádná reakce :-(
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » úte úno 02, 2021 19:50

greghouse píše:…číslo snímku je … u … matrik v podstatě nepodstatná informace, protože se během času stejně změní a podstatný je název souboru snímku…
Přesně tak.
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » úte úno 02, 2021 19:53

Každý by to převádění měl provádět na vlastní nebezpečí.

Třeba já potřebuju s těmi odkazy pracovat a fakt aktuálně nemám na to převádět si ty odkazy přes jakýkoliv převodník jednotlivě - čili jsem si to hromadně převedl. Původní verze mám a kdyby někde nastal zádrhel, mám jak se z toho vykopat, ale čekat, než se vše opraví a dá dohromady, skutečně nehodlám.
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » úte úno 02, 2021 19:58

Přidám k odkazu ke stažení upozornění.
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » úte úno 02, 2021 20:03

Jj, nechť si každý nechá i původní verze dokumentů, převede si je pro práci a až budou vychytané chyby, převede si to pak "načisto".
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: Převodník odkazů MZA Acta Publica

Příspěvekod greghouse » stř úno 03, 2021 3:37

Je akceptovatelné, aby pro matriku s původním děleným rozsahem stránek dejme tomu 1-10 a 20-30 (strany 11-19 by původně hlásily to známe "Soubor nenalezen"), by to vracelo např. pro odkaz na stranu 15 (http://actapublica.eu/matriky/brno/proh ... ?strana=15) to vracelo platný odkaz na soubor (aktuálně neexistujícího) snímku https://www.mza.cz/actapublica/matrika/ ... -00150.jp2 ? Nebo to považovat za neplatný převod, vypsat hlášku do protokolu a odkaz ponechat v původní podobě?
Převodník starých odkazů Acta Publica - pro převod starých odkazů jednotlivě, hromadně i v souborech.
Uživatelský avatar
greghouse
 
Příspěvky: 484
Registrován: stř pro 26, 2018 1:04
Oblast pátrání: Tukleky a okolí (okres Písek), Telč, Dačice a okolí, Derfle a okolní obce

Re: Převodník odkazů MZA Acta Publica

Příspěvekod zburget » stř úno 03, 2021 8:08

Já bych vrátil neplatný převod - ty strany tehdy oficiálně neexistovaly a dnes neexistují vůbec. Nemělo by se stát, aby někdo takovou stranu převáděl. Pokud se o to bude pokoušet, někde je chyba a mělo by na ni být upozorněno.
Zbyněk Burget
zburget
 
Příspěvky: 12599
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

PředchozíDalší

Zpět na O archivech

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 37 návštevníků