OCR pro rucne psany text s doucovanim

Máte nějaký nápad o kterýse chcete podělit, nebo radu kterou chcete přispět ostatním v jejich genealogickém úsilí? Můžete ji napsat sem.

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » pát dub 23, 2021 6:50

Hm, prošla jsem tu první stránku a bylo tam víc takhle odentrovaných blbostí, kde nebyl doplněný text... U jedné bych řekla, že jsem se v nepozornosti sekla, ale bylo jich tam 6. Tak přemýšlím jestli jsem opravdu tak nepozorná, a potvrdila jsem je, když tam půlka slov nebyla a tajně doufám, že tak mimo opravdu nejsem ani večer... :( Další tři stránky jsem ještě taky namátkově kontrolovala, ale tam už se snad situace neopakuje.
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » pát dub 23, 2021 7:25

Když jsem byla u toho odznačování, ještě mne pak napadlo:
Enter - potvrdí označení
Esc - zruší označení, ale zároveň i smaže vše, co bylo uvnitř přepsáno

Nebylo by lepší udělat Esc jako opak Enter - tzn. jen zruší označení, ale zároveň napsaný text uvnitř ponechá?
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » pát dub 23, 2021 8:49

Nezpůsobila jste mi žádný problém, jen se to Vaše OCR špatně trénovalo.

S tím Esc to tak můžu udělat, pokud chcete, ale zrušit pouze přepis bez vymazání jde i pravým tlačítkem myši.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » pát dub 23, 2021 10:30

Aha, tak v tom pripade to nechte, jak to je.
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » ned dub 25, 2021 19:32

Dokončil jsem trénování CRNN OCR. Přidal jsem instance natrénovaných instancí mezi dostupné globální instance (můžete jimi pouze inferovat/dědit). Přidal jsem taky možnost přechodu mezi anotacemi pomocí klávesy horní a dolní šipky, aby jste nemuseli pokaždé klikat myší.

Úkoly, které byly plánovány jsou už dokončeny.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » ned dub 25, 2021 20:30

Jen dotaz - ty instance CRNN, které jsme měli, předpokládám, už nejsou…
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » ned dub 25, 2021 20:43

Skákání šipkami je bezva... Já se radši blbě zeptám, protože slova globální instance a interferovat mi moc neříkají a zatím jsem ani nic převratného nezdědila :)... Mám teda dál trénovat do CRNN OCR - Soa Zámrsk / Dubenec - num epoch cca 10 ?
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » ned dub 25, 2021 20:46

Ano, můžete pokračovat stejně jako doteď :)
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » ned dub 25, 2021 20:56

Já bych přece jen poprosil o zvětšení oblasti, za kterou se dá chytit bod při editaci polygonu. Chytit některé body je téměř nadlidský úkol :-(
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » ned dub 25, 2021 21:00

Jo za zvětšení oblasti bych se taky přimluvila, jestli na nás máte dost času...

Ještě k tomu dědění a dalším cizím slovům :):
Takže bych si mohla svého neobratně natrénovaného Zámrského OCR prokřížit s kolegovým zburgetovým namakaným OCR a jejich nový potomek by mohl podědit moji krásu a zburgetovu schopnost číst staré texty? Nebo jste je už takhle nějak křížil?
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » pon dub 26, 2021 7:52

Já myslím, že ty "oficiální" OCR modely jsou trénované na nějakých "zaručených" sadách, které někdo nějak připravil a "zaručeně" přepsal.
A budou to určitě řádově minimálně desetitisíce řádků.
S tím se tady to naše hraní asi, bohužel, nedá srovnávat :-)

U nás je problém taky v tom, že vlastně nemáme ani přesné instrukce, jak některé věci přepisovat. Já pro svůj testovací latinský dataset vlastn ani nemám kompletní znakovou sadu (protože vím, že třeba zrovna ta pořád zmiňovaná ligatura æ se při přepisech má zapisovat ligaturou a ne rozepisovat, jako ae). Takže věřím, že na úspěšnou obhajobu diplomky to, co je bude bohatě stačit. Výsledky to dává velice dobré.
A jen doufám, že po obhajobě se na tom ještě bude pracovat a budou se opravovat věci, které by teď té obhajobě jen uškodily. Určitě se nemůže měnit znaková sada, určitě se nemůže sahat do jiných kritických míst v OCR. Můžná se můžou opravovat takové ptákoviny, jako editace polygonů, ale na to zřejmě prostě teď není čas.
Musíme si počkat, držet všechny palce, aby obhajova dopadla dobře, a doufat, že se po ní buď autor aplikace sám nebo lépe i ještě někdo další bude věnovat dalšímu vývoji, že bude zapracováno co nejvíc návrhů a nápadů nejen nás, ale i dalších, kdo s tím budou pracovat a taky, že k tomu bude vypracovaný i nějaký metodický materiál, jak ty přepisy přesně dělat. Možná jsou to věci, které jsou historikům všeobecně známé, ale my, laici, to nevíme. A čekat, až k tomu někdo, byť povolanější, dodá dostatečné množství trénovacích dat, se mi úplně nechce. To si ta trénovací data budu radši pomalu vytvářet sám :-). Jen to musí mít nějaký řád, abych to nedělal jen sám pro sebe. To by byla škoda práce a času.
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » pon dub 26, 2021 8:10

Zapomněl jsem napsat, že během trénování nových instancí OCR jsem rozšířil i tu trénovací sadu, takže tu Vaši ligaturu už tam máte :)
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

Re: OCR pro rucne psany text s doucovanim

Příspěvekod zburget » pon dub 26, 2021 8:29

Wow!!! Díky!
Tak to si s tím zase určitě dobře "pohraju". Ještě chci s vaším vedoucím práce trochu probrat ten automatický anotátor. Pak si poupravím řádky, aby to nestříhalo kusy písmen (protože mi to dělá z velkého C závorku "("; z velkého B malé b; p mi to občas ustřihne až na a :-(). A pustím se do přepisů. Teď po natrénování na těch kronikách je to s latinou úplně totálně vedle. Tak musím začít od začátku. A nechci to trénovat ani na té mojí testovací sadě, protože ta je pravě anotovaná dost blbě.
Ale nějak si s tím poradím :-)
Zbyněk Burget
zburget
 
Příspěvky: 12523
Registrován: pon dub 30, 2018 17:15
Bydliště: Nezamyslice [okr. Prostějov]
Oblast pátrání: Konicko, Protivanovsko (okres Prostějov)
Boskovicko

Re: OCR pro rucne psany text s doucovanim

Příspěvekod matju » pon dub 26, 2021 9:40

Jo, na tu metodiku transliterace by to chtělo ještě zadat diplomku někomu, kdo studuje paleografii nebo něco podobně zaměřeného.. :))
TY Michala Maturová
matju
 
Příspěvky: 1025
Registrován: čtv úno 14, 2013 22:50
Oblast pátrání: Hradecko, Jičínsko, Trutnovsko, Železnobrodsko, Hořicko, Berounsko, Střední čechy
https://www.mojekoreny.com/

Re: OCR pro rucne psany text s doucovanim

Příspěvekod Davidh » pon dub 26, 2021 9:51

Ještě prosím nespouštějte úkoly pro CRNN OCR, jelikož ladím nějaké grafy v práci a potřebuji na těch GPU něco počítat :) Během dneška napíšu až budu mít hotovo. Díky.
Davidh
 
Příspěvky: 46
Registrován: čtv dub 08, 2021 13:25

PředchozíDalší

Zpět na Nápady

Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 7 návštevníků