Stránka 3 z 5

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte úno 16, 2021 12:31
od lechat
Zora píše:Jen upozorňuji, že příslušnost k panství u konkr. obce v průběhu let měnila.

Já vím, že se měnila. Ale od začátku jsem se zařekl, že časové závislosti do databáze zanášet nebudu, bylo by to celé o řád komplikovanější. Už jen změny okresů (např v roce 1960) atd. Nehledě na to, že spousta zdrojů časový rozsah vůbec neuvádí.
Prostě bych přidal příslušnost ke všem panstvím podle dostupných zdrojů bez časového údaje.

Děkuji za odkazy. Prozkoumám.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte úno 16, 2021 12:40
od Zora
Naprostý souhlas, časový rozsah ne, velice špatně se dohledává a v matrikách je občas i chyba, panství se změnilo, ale zapisující uvedl to předešlé.

Tohle vůbec netuším,. zda by mohlo pomoci - klikla jsme na druhý díl, ale to není podstatné, stahuje se to v pdf.
Ladislav Hosák - Rudolf Šrámek: Místní jména na Moravě a ve Slezsku. (Díl 2,M-Ž)

https://www.academia.edu/28727583/Ladis ... _M_%C5%BD_

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte úno 16, 2021 12:43
od Zora
také mám uloženo tohle, ale netuším, zda jste již nepoužil a zda je to vůbec použitelné

http://www.archives.cz/web/DA_resources ... Moravy.pdf

Z

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: stř bře 10, 2021 14:28
od lechat
Ahoj,

doplnil jsem osady a samoty ze zanikleobce.cz, celkem asi 1500 novych nazvu.

MZA jsem zatim netezil znovu, pockam az se to tam trochu urovna. Nehlede na zbytecne zatezovani uz takhle pretizenych serveru.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: pát dub 16, 2021 7:57
od zburget
Téma přesunuto do místopisu a připíchnuto mezi důležitá, na začátku zobrazovaná vlákna.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: ned kvě 02, 2021 9:11
od lechat
Ahoj,

pridal jsem moznost vyhledavani podle nastavene miry podobnosti. Regularni vyrazy uzivatele moc zatim nepouzivaji, a myslim, ze tohle je pro bezneho smrtelnika lepsi varianta, nez se morit s regex znaky :wink:
Nastaveny stupen podobnosti odpovida poctu znaku ktere se mohou mezi zadanym vyrazem a nazvem lisit. Na pozadi se pouziva levenshteinova vzdalenost dvou retezcu, ktera spocita o kolik znaku se dva vstupni retezce lisi.
Vyzkousejte a dejte vedet zpetnou vazbu. Diky.

A jeste jedna novinka. Poridil jsem Chytilům místopis CSR a postupne ho budu digitalizovat. Zatim pracuji na vyuce OCR (Tesseract, v podstate to same co pouzivaji kolegove z vlakna "OCR pro rucne psany text s doucovanim", akorat oni to maji o par radu komplikovanejsi) aby se naucil konkretni pouzite fonty z knihy a dosahl jsem vyssi presnosti. Defaultni cestina v OCR Tesseractu ma problem s nekterymi znaky, napr f casto zamenuje za i atp.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: ned kvě 02, 2021 9:38
od zeter
(za tu aplikaci vřelý dík, využívám každou chvíli - jak pro vlastní účely, tak tu na fóru v sekci Čtení -, a je to velká pomoc)

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: ned kvě 02, 2021 9:49
od Zora
Já se připojuji, to nedohledatelné se dost často díky Vám stává naprosto jasným :-)
Díky. Z

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: ned kvě 02, 2021 10:08
od Mistr Jan
Přesně tak, už mně to taky mnohokrát pomohlo... Děkuji :) :wink:
J.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: stř kvě 19, 2021 9:57
od zeter
jenom takový postřeh k vyhledavači - u dotazu ve Čtení se vyskytla obec Baumgarten. Když ji zadám do vyhledavače, vypadne obec Sádek. Pan Burget tu obec ovšem identifikoval jako obec Horní Pěna (Ober Baumgarten).
Zjevně je to kvůli zaškrtnutému "Pevný začátek", zaškrtnuté "Kdekoli" už samozřejmě vyhodí hned několik různých Horních/Dolních :-)
Když má člověk jenom fragment názvu, trkne ho to, ale u celého slova ne nutně. Nebylo by třeba možné ten "Pevný začátek" u jednotlivých obcí s víceslovným názvem chápat jako "pevný začátek kteréhokoli slova ve víceslovném názvu"?
Jen námět k diskusi...

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: stř kvě 19, 2021 13:26
od lechat
To asi nebude problem upravit. Akorat to trosku rozhodi tu filozofii tech ostatnich voleb (pevne hranice, pevny konec), protoze ty by se chytaly stale na konec celeho nazvu.
Asi bych tam pridal jeste dalsi volbu. Neco jako "Flexibilní začátek" a ta by byla defaultní a chytala by na zacatek kazdeho slova v nazvu.

Ja ted s tim Chytilovym mistopisem RCS resim problem trochu podobny. V mistopisu jsou nektere nazvy upraveny tak, ze umistili podstatne jmeno pred pridavne, tj namisto Horní Babákov, je tam uvedeno Babákov Horní, coz pro potreby abecedniho poradi a hledani je samozrejme prirozenejsi.
Nicmene abych ziskal zpet puvodni variantu, tak si lamu hlavu co s tim :? Nenapada me zatim zadny automatizovany zpusob jak to udelat aniz bych tam zanesl mraky chybnych presmycek. Takze zvazuju, ze je ponecham v puvodnim stavu a nejak upravim to vyhledavani, takze vase poznamka je vlastne ku prospechu i tohoto problemu 8)

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: stř kvě 19, 2021 14:18
od zeter
Jasně, já tu logiku hledání na začátku/na konci/kdekoli chápu - jde mi jen o to, aby se eliminovala možnost, že si někdo nevšimne, nezatrhne správné políčko atd.
Co třeba výsledky hledání s pevným začátkem prezentovat "hierarchicky" - prvně jednoslovné, pak víceslovné? Tzn. třeba na ten dotaz Baumgarten by to vyhodilo úplně nahoře Sádek, a pod nějakým nenápadným oddělovačem všechny ostatní výstupy, kde je Baumgarten jako jedno slovo součástí víceslovného názvu.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: stř kvě 19, 2021 19:53
od lechat
Asi bych nakonec volil uplne tu puvodni variantu, tj za zacatek a konec se bude povazovat i mezera u vsech voleb (zacatek, stred, konec a mozna i pevne hranice), bude to cesta nejmensiho odporu. Uprava je trivialni, a nez tam zavadet dalsi volby nebo nejake viceurovnove trideni bude to takhle snad prehlednejsi. Kdyz se to ukaze jako nevhodne, muzu po kdykoli upravit. Vecer to jeste promyslim, co se tim vsechno muze kde rozbit :)

A jeste jedna vec, v tomhle vlakne jsem narazil na zminku o dvojich Litovicich. Na tohle pozor, v tomhle pripade jde o to, ze SOA Praha ma Litovice zminene u dvou ruznych puvodcu a kazdy puvodce je zarazeny do jineho okresu. Tim padem z toho vzniknou dvoje Litovice, protoze nelze rozlisit zda je to jedna a tataz obec nebo jina stejneho jmena. Zde Svarov a zde Hostivice. Bohuzel tim ze je to cele grabovane automatem s tim toho moc neudelam. Rucni zasahy v ramci zachovani dusevniho zdravi a casu odmitam provadet. Je to zminene v popisce zdroju na strance, kde jsem na podobne problemy narazil i u jinych obci. Je mozne, ze Litovice patrily drive k jednomu okresu a ted k jinemu, nevim, nijak dal jsem nezkomal proc to takhle maji uvedene.

Dodatek: Jeste jsem si vsimnul, ze obec Sobin je tam takhle dokonce 3x. Tohle je obecny problem vsech obci ktere se vyskytuji pobliz hranic okresu :roll:

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: čtv kvě 20, 2021 9:00
od lechat
Tak upraveno, nutny reload stranky.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: čtv kvě 20, 2021 9:14
od zeter
Díky!

Jinak ty Litovice - já jen hledal, jestli existuje i přesně ten název, a dál jsem to nezkoumal, jinak bych na to přišel (teda doufám :-) )
Takovýchhle "dvojníků" bude asi dost, a taky si myslím, že to nemá cenu řešit ručně; naopak se mi zdá, že to aspoň člověka upozorní, že má co dělat s obcí, která může mít archiválie rozfrcané ve více archivech.