OCR pro rucne psany text s doucovanim

Máte nějaký nápad o kterýse chcete podělit, nebo radu kterou chcete přispět ostatním v jejich genealogickém úsilí? Můžete ji napsat sem.

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » pon dub 12, 2021 18:53

Davidh píše:Až bude možné upravovat regiony a řádky ručně, tak bude stačit pouze upravit ty polygony, přepisy se nesmažou. Nebo to chápu špatně? :)
Některé ty polygony jsou teď úplně blbě. Řádek rozstříhaný na několik kousků a tak. Takže budu muset nějaké kousky smazat a jiné dokreslit. A já to hlavně začal zkoušet na datasetu, který vznikl při nahrání těch zpřeházených skenů. Na čisto bych to pak pustil na jiném datasetu - kde mě tedy bude hlavně na první pokus zajímat, jak dobře to bude ochotné přečíst to, co už jsem mu ručně přepsal a na čem se trénoval.
Pokud to přečte zmatky, tak bych nerad celé stránky přepisoval znovu, ale kdyby to bylo možné, nějak bych tam ty texty nakopíroval. Ale sázet to tam žádek po řádku bude taky pakárna :-(
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » pon dub 12, 2021 18:56

Duke of York píše:Ja bych byl nejradeji, kdyby se to OCR propojilo s DEMoSem. Pak by se ty udaje, co OCR rozpozna daly rovnou sazet do databaze. Jenze blby je, ze my nevime, co je ktere slovo zac, jestli je to obec, jmeno ditete, prijmeni matky a tak. Proto taky nemuzeme ta data, co vznikla prepisem pro DEMoS, pouzit na uceni OCR. Chci na to vyrobit nejakou diplomku, ale to je na dlouhy lokte...
Tak - ono by se asi daly přečíst hlavičky sloupců :-) Ale - občas to zapisující zpřeházel i tak a ve starších matrikách ty hlavičky třeba vůbec nejsou. Ale zase - když už se na to vymýšlí nějaká umělá inteligence, tak by se to mohlo naučit poznat, o jaký typ matriky se jedná (N,O,Z) a pak odhadnout, co v tom kterém políčku vlastně je (podle jeho struktury) - ale to je zase nějaká úplně jiná, další hezká diplomka :-)
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » stř dub 14, 2021 11:56

Vylepšil jsem vyřezávání polygonů z obrázků (při trénování a inferenci). Po vyřezání polygonu se spočte úhel a vyřezaný řádek se pootočí, aby byl rovně. To by mohlo OCR pomoct.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » stř dub 14, 2021 13:03

Nepouštěl jste mi tam nějaké trénování a čtení? Objevily se mi tam nějaké úkoly, u kterých si asi ani nejsem vědom, že jsem je pouštěl - hlavně ne s těmi parametry, co tam jsou. Trénování pouštím vždycky s 10 epochami a teď tam vidím 100,200,1000,2000 :shock:
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » stř dub 14, 2021 13:27

Já tam zase zkouším nahrát do datasetu scany, sice se tváří, že jsou nahrány, ale když bych ráda na Anotaci, tváří se , že tam žádný obrázek nahrán nemám.. Tlačítko Zobrazit anotace se mi vůbec neobjeví. Tak nevím, jestli to zlobí, nebo jestli dělám něco blbě...
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » stř dub 14, 2021 13:39

zburget píše:Nepouštěl jste mi tam nějaké trénování a čtení? Objevily se mi tam nějaké úkoly, u kterých si asi ani nejsem vědom, že jsem je pouštěl - hlavně ne s těmi parametry, co tam jsou. Trénování pouštím vždycky s 10 epochami a teď tam vidím 100,200,1000,2000 :shock:


Ano, včera jsem si všiml, že jste spouštěl nějaké tréninky, ale jelikož jsem updatoval OCR, tak nedoběhly, takže jsem je spustil znovu. Dneska jsem dodělal to vylepšené vyřezávání polygonů, takže jsem to pak zkoušel trénovat na Vašem datasetu. V případě Tesseract volte spíše stovky epoch, aby se to reálně zlepšilo.

Jestli jste to nechtěl trénovat, tak se omlouvám :)
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » stř dub 14, 2021 13:56

matju píše:Já tam zase zkouším nahrát do datasetu scany, sice se tváří, že jsou nahrány, ale když bych ráda na Anotaci, tváří se , že tam žádný obrázek nahrán nemám.. Tlačítko Zobrazit anotace se mi vůbec neobjeví. Tak nevím, jestli to zlobí, nebo jestli dělám něco blbě...


Toto se nestávalo, dlouho jsem nic ručně nenahrával, tak jsem si toho nevšiml. Chybu opravím a dám vědět. Díky.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » stř dub 14, 2021 14:13

Došlo místo na disku.. Už by to mělo fungovat.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » stř dub 14, 2021 17:24

Jo, už funguje :)
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » stř dub 14, 2021 17:59

Dotazy (omlouvám se, pokud hloupé :) :
1) lze obrázek v anotaci nějak zoomovat?
2) k čemu slouží textový region?
3) jak lze vybrat text jinak, než pomocí obdélníku (např. polygon?)
4) představovala jsem si, že když vlezu do anotace, vytvoří počítač automaticky nějaké anotace a já je pak upravuji (potvrzuji) - což se u mne nestalo - mám tam úplně prázdný scan - je to tak ok?
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » stř dub 14, 2021 19:05

1) Po vybrání ze seznamu nástorů z levé lišty nástroj pro zoomování můžete zoomovat pomocí kolečka nebo touchpadu :).
2) Textové regiony budou sloužit do budoucna pro určení pořadí čtení.
3) Anotace polygonů přídám.
4) Aby se zdetekovaly anotace, musíte pro dataset vytvořit nový úkol typu "Detekování řádku a textových regionů". Pro následné přečtení obsahu těchto zdetekovaných řádků pak vytvořte úkol "Zjištění přepisu označených řádků textu pomocí OCR". Viděl jsem, že jste nějaký úkol na detekci vytvořila, ale zůstal pouze plánovaný, protože jsem zrovna trénoval OCR. Už máte dataset zdetekovaný. Na detekcích jsem vám spustil trochu naučenou síť od zburget pro přečtení textu.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » stř dub 14, 2021 19:44

1) bohužel kolečko na myši mi na zoom nefachá, ač standartně na zoom funguje (například v digi matrikách)..
2) ok
3) ok
4) aha, takže jste to spustil vy :) No vytvořila jsem úkol na detekci, ale nějak jsem nepochopila, jak ho spustit... Teď jsem to zkoušela znovu a už mi to fungovalo, asi jsem se zvedla ze židle a poposedla si na vedení... :))
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » stř dub 14, 2021 20:14

Vytvořené úkoly se zařazujíí do fronty, odkud se postupně odebírají a vykonávají. Já jsem měl spuštěný úkol pro trénink OCR, takže se váš úkol pouze naplánoval, ale nespustil. :)
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » stř dub 14, 2021 20:53

Mně zoom nefunguje. Nikde na to tam nevidím nástroj. V levé liště sice je poslední nástroj "Ostatní", ale nejde vybrat.
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » stř dub 14, 2021 20:54

Davidh píše:Jestli jste to nechtěl trénovat, tak se omlouvám :)
Trénování mi nijak nevadí (když se u toho já nezapotím) :-) Mně jen překvapilo, co se mi to tam objevilo :-)
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

PředchozíDalší

Zpět na Nápady

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 8 návštevníků