Stránka 1 z 5

Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte říj 20, 2020 11:38
od lechat
Ahoj,

ve vlákně Nová aplikace pro ActaPublica - aktuální informace se mihlo téma na možný převodník staré>nové odkazy do MZA.

Chtěl bych otevřít téma na různé geneo utilitky které by nám usnadnili práci. Osobně, jakožto začátečnický čtenář starých textů, jsem již několikrát potřeboval rozluštit název vesnice nebo města u kterého jsem si nebyl vůbec jistý. A jelikoz není uplně snadné dohledat názvy obcí např. v googlu nebo na mapách pokud nevíte přesnější název, udělal jsem si malý nástroj který výhledává podle tzv. regulárního výrazu (umožní zadat pevné a nejisté znaky) v názvech obcí které jsem získal z nějakého státního portálu a z Wiki. Podstatné je, že na Wiki jsou i německé varianty názvu které se často i v českých textech vyskytují.

Zatím je to jen ve fázi pokusu a především zdroje neobsahují zdaleka všechny obce. Pokud by se projevil vážnější zájem a tahle utilitka by byla někomu nápomocná, jsem ochoten investovat do ní nějaký čas a dotáhnout jí do použitelného stavu.

Tady je link: Vyhledávání v názvech obcí ČR
Prosím o shovívavost, je to opravdu jen nástřel, především sekce se spřežkami je jen spíš takový úlet :)

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte říj 20, 2020 13:04
od zeter
Jenom jsem zběžně nakoukl - rozhodně zaveďte ekvivalenci V/W, I/Y a možná i další - otestujte si funkčnost na S(I/Y)RO(V/W)(I/Y)N (všechny permutace), dává to dost nekonzistentní výsledky.
Horší to bude u poměrně běžného problému - změna nebo přídání počátečního písmene - měli jsme tu nedávno DIETIN ---> moderně ZDĚTÍN.
Těžko říct, jesti by se daly nějak vytěžit popisky matrik v archivech, kde mají ty varianty kolikrát velmi dobře podchycené.
A ještě nápad, ale abych vás nezahltil - německá verze wiki mívá solidně zpracovaný dole v odkazech seznam sousedních obcí.
Já jsem typický bfu, takže nevím, zda je to nějak implementovatelné... no a vůbec: Řím taky nepostavili za den.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte říj 20, 2020 14:54
od zburget
K těm ekvivalencím - bych ještě přidal S=Z, G=J, I=Y=J

Pak občas dochází k různým přesmyčkám R<->L, ale to už by jakýkoli regulární výraz začal dávat kvanta nsmyslnýh výsledků.

Jak vzpomínak kolega Zdětín, tak já mám ve své oblasti taky špek Hrochov = Rochov = Rohov
Konice je psána jako Kunice, Knínice zase jako Kynice. Těch variant je tolik, že se bojím, že by musela být databáze současných názvů a ke každému z nich tabulka se všemi existujícími variantami.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte říj 20, 2020 15:02
od Zora
Tabulka variant názvů obcí je slušně zpracovaná na acta publica. , třeba by se dala použit. Z

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: pon led 11, 2021 12:05
od lechat
Zdravim vsechny v novem roce :)
jen aktualizuju status.

Puvodni databazi obci jsem zahodil a zacal sestavovat uplne novou. Zakladem je RUIAN + mam jiz vytezene vsechny oblastni archivy + wikipedii a take zanikleobce.cz. Nebyla to uplne lehka prace ale podarilo se ziskat pres 22 000 obci a celkem pres 40 000 alternativnich nazvu!
Z oblastnich archivu jsem prevzal i informaci o tom ktery puvodce se k dane obci vztahuje (obcas se to muze hodit).

Dalo by se sehnat jeste vice. Napriklad Opava nabizi extra odkaz na
Mistopisny_rejstrik_obci_ceskeho_Slezska_a_severni_Moravy.pdf ktery ma velke mnozstvi informaci o nazvech, nicmene ten se mi nepodarilo spolehlive rozebrat a vybrat z nej potrebne informace. Texty obcas obsahuji extra informace navic a pri automatickem parsovani to potom dela neplechu a dostavaji se do vysledku i informace ktere tam vubec byt nemaji.

Nyni delam na vyhledavacim formular (ruzne filtrovani podle okresu a okolnich okresu, vzdalenosti obci od sebe atd.) Az se to posune do pouzitelneho stadia, hodim sem odkaz.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: pon led 11, 2021 12:23
od lechat
zeter píše:A ještě nápad, ale abych vás nezahltil - německá verze wiki mívá solidně zpracovaný dole v odkazech seznam sousedních obcí.

Muzete sem prosim dat presny odkaz? Diky.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 19:34
od lechat
Nova aplikace je dostupna na http://obcecr.skytechx.eu/

Prosim o pripominky, namety a nazory. Predevsim co se filtrovani tyce.
Postupne jeste dodelavam ruzne nedodelane veci.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 19:59
od matju
Dobré chválím...

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 20:15
od janamic
také chválím a posílám připomínku
zkusila jsem zadat "miškovice" a vytrvale mi to vypisovalo vše co začíná mi - Pro výraz mi bylo nalezeno více než 50 záznamů. Ostatní záznamy nebudou zobrazeny.
myslím, že to má problém s písmenem Š, u výrazu "mirovice" mi to nedělalo

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 20:23
od Radix
Co znamená v kolonce Původce:
Babice (SOA Zámrsk)

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 20:30
od lechat
ad : "miškovice" opraveny, s cestinou to problem nema, ale padalo to jinde :)

ad : Babice (SOA Zámrsk) - sloupec puvodce obsahuje vsechny puvodce kteri se k dane obci vztahuji, zde SOA Zamrsk ve svem PDF zminuje, ze puvodce/farnost Babice ma dostupne nejake matriky k dane obci. Zkusim potom rozepsat nejake detailnejsi info o tech puvodcich.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 21:36
od zedir
Skvělá pomůcka, také chválím a oceňuji.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 23:09
od karels
Přidávám se, že to je dobrá pomůcka. Bohužel zatím mohu jen teoretizovat, protože mezi klávesnicí a židlí je něco, co bych potřeboval nakopnout.
U první verze po zadání již prvního znaku byla zřejmá reakce, po 3 znacích již výpis obcí, které vyhovovaly. V nové verzi zadávám znaky a nic se neděje. Prosím o radu. Nebo je na závadu, že používám XP?
Upřesním: po zadání druhého znaku se zvětší šedé pole o jeden řádek (žlutý nápis Obce České republiky se posunou dolů). K tomuto nedojde, pokud před zadáváním znaků vyplním alespoň jedno políčko v části Ekvivalence znaků.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: úte led 12, 2021 23:31
od lechat
karels píše:Přidávám se, že to je dobrá pomůcka. Bohužel zatím mohu jen teoretizovat, protože mezi klávesnicí a židlí je něco, co bych potřeboval nakopnout.
U první verze po zadání již prvního znaku byla zřejmá reakce, po 3 znacích již výpis obcí, které vyhovovaly. V nové verzi zadávám znaky a nic se neděje. Prosím o radu. Nebo je na závadu, že používám XP?
Upřesním: po zadání druhého znaku se zvětší šedé pole o jeden řádek (žlutý nápis Obce České republiky se posunou dolů). K tomuto nedojde, pokud před zadáváním znaků vyplním alespoň jedno políčko v části Ekvivalence znaků.


Jaky mate prohlizec? Pokud je to Internet Explorer, tak jakou verzi :wink:
Pripadne se jeste podivejte do konzole prohlizece (F12) jestli to tam neco nepise. A jeste sem hodte vyraz ktery hledate.
Obecne se starsima verzema (hadam podle tech Win XP) bude potiz, ale zkusime s tim neco udelat.

Re: Vyhledávání v názvech obcí ČR

PříspěvekNapsal: stř led 13, 2021 1:49
od zburget
karels píše:… Nebo je na závadu, že používám XP?
Je to věc nesouvidející s touhle aplikací, ale je to problém všeobecný - používání XP je dnes velice těžce na závadu. Fungují v něm pouze prehistorické prohlížeče, které dnes mají problém s čím dál více stránkami, ani XP, ani prohlížeče nejsou vůbec udržované. Takže jakákoli chyba nebo zranitelnost, která bude (byla za posledních 6 let) objevena nebude opravena a je to potenciální místo, kudy se vám do PC může dostat nějaká potvora.
XP co nejdřív zlikvidujte a vyměňte za W10 - jediný dnes podporovaný systém. Cokoli jiného by se už vůbec nemělo objevit na jakémkoli stroji připojeném k internetu. Nepočítám tedy W8.1, které ne každému sedly a dnes není nejmenší důvod o nich uvažovat.