Ten projekt DEMoS je náš
Už jsem se tady o tom možná někdy zmiňoval, nebo jsem se kdysi ptal, jestli neco podobného neexistuje (na okoun.cz). Zatím je to teda ve stavu, že vyrábíme excelovské šablony a do nich pak lidi z Masaryčky přepisují záznamy a když narazí na něco, pro co v šabloně není kolonka, tak tu šablonu opravíme a tak pořád dokola. Prostě problém slepice a vejce
Zároveň kolega vytváří databázi podle té šablony a další kolega a studenti k tomu dělají zbytek webu (to je ten demos na perunu). Občas tam někdo něco rozbije, tak to přestane fungovat, ale teď by to mělo jet. Nevím, jestli momentálně funguje registrace, ale jestli jo, tak tam můžete zkusit něco pokusně přepsat.
Kazdopádně, databáze pro pokřtěné by mohla už být hotová, pro zemřelé a oddané snad bude brzo. Máme už i jakýsi návrh šablony pro Lánové rejstříky a teďka chceme začít vyrábět Rektifikační akta a Sčítací operáty. U urbářů a pozemkových knih jsme zatím ve stavu, že jsme naznali, že je to podobný pramen a sloučíme je dohromady. Budou tam ale jen lidé, ty platby a převody tam zatím nebudou, protože by to bylo hrozně komplikované. Trochu problém je s prameny pro Čechy
Co se týče přepisu, tak jsme se rozhodli, že databáze nebude sloužit jen pro genealogy, ale i pro jiné vědce, tak bylo dohodnuto, že se všechny zápisy budou transliterovat. Aby se v tom pak dalo vyhledávat, měla by mít každá položka i svou standardizovanou variantu (proto ta bakalářka), proto je tam také odkaz na Standardizaci a když zadáte nějaký záznam, máte ještě možnost tam uvést i standardizované varianty.
Co se týče nějaké automatizace, tak kolega dělá prográmek, který by měl automaticky rozpoznat, kolik je na jedné stránce záznamů. Když už k ničemu, tak aspoň pak budeme vědět, kolik je ve všech matrikách záznamů
Ale hlavně by to mělo sloužit k tomu, aby se v databázi udělali jakési prázdné záznamy a do těch se pak budou vepisovat ty přepsané údaje. Chtěli bychom zkusit i nějaké rozpoznávání jednoduchých věcí, jako je např. číslo domů a tak. Možná by se mohlo povést i detekovat na scanu jména pokřtěných a jejich rodičů. Pak by se tyhla části daly ze scanu "vykousnout" a udělala by se z nich nová stránka, prohlížení by pak bylo mnohem rychlejší. Co se týče čtení ručně psaného textu, tak na tom dělají velké týmy po celém světě (a i kolegové u nás ve škole, i když teda na jiném projektu). Je to hrozně tězká věc, takže to do těchhle Vánoc nebude a možná ani do těch příštích.
Ještě teda, někteří lidé maji strach, že v těch přepisech budou chyby. Je jasné, že budou. Ale každý bude mít možnost se na web přihlásit a chyby opravit