GENEALOGIE

od **matju** » pát dub 23, 2021 6:50

Hm, prošla jsem tu první stránku a bylo tam víc takhle odentrovaných blbostí, kde nebyl doplněný text... U jedné bych řekla, že jsem se v nepozornosti sekla, ale bylo jich tam 6. Tak přemýšlím jestli jsem opravdu tak nepozorná, a potvrdila jsem je, když tam půlka slov nebyla a tajně doufám, že tak mimo opravdu nejsem ani večer...

Další tři stránky jsem ještě taky namátkově kontrolovala, ale tam už se snad situace neopakuje.

od **matju** » pát dub 23, 2021 7:25

Když jsem byla u toho odznačování, ještě mne pak napadlo:
Enter - potvrdí označení
Esc - zruší označení, ale zároveň i smaže vše, co bylo uvnitř přepsáno

Nebylo by lepší udělat Esc jako opak Enter - tzn. jen zruší označení, ale zároveň napsaný text uvnitř ponechá?

od **Davidh** » pát dub 23, 2021 8:49

Nezpůsobila jste mi žádný problém, jen se to Vaše OCR špatně trénovalo.

S tím Esc to tak můžu udělat, pokud chcete, ale zrušit pouze přepis bez vymazání jde i pravým tlačítkem myši.

od **matju** » pát dub 23, 2021 10:30

Aha, tak v tom pripade to nechte, jak to je.

od **Davidh** » ned dub 25, 2021 19:32

Dokončil jsem trénování CRNN OCR. Přidal jsem instance natrénovaných instancí mezi dostupné globální instance (můžete jimi pouze inferovat/dědit). Přidal jsem taky možnost přechodu mezi anotacemi pomocí klávesy horní a dolní šipky, aby jste nemuseli pokaždé klikat myší.

Úkoly, které byly plánovány jsou už dokončeny.

od **zburget** » ned dub 25, 2021 20:30

Jen dotaz - ty instance CRNN, které jsme měli, předpokládám, už nejsou…

od **matju** » ned dub 25, 2021 20:43

Skákání šipkami je bezva... Já se radši blbě zeptám, protože slova globální instance a interferovat mi moc neříkají a zatím jsem ani nic převratného nezdědila

... Mám teda dál trénovat do CRNN OCR - Soa Zámrsk / Dubenec - num epoch cca 10 ?

od **Davidh** » ned dub 25, 2021 20:46

Ano, můžete pokračovat stejně jako doteď

od **zburget** » ned dub 25, 2021 20:56

Já bych přece jen poprosil o zvětšení oblasti, za kterou se dá chytit bod při editaci polygonu. Chytit některé body je téměř nadlidský úkol :-(

od **matju** » ned dub 25, 2021 21:00

Jo za zvětšení oblasti bych se taky přimluvila, jestli na nás máte dost času...

Ještě k tomu dědění a dalším cizím slovům

:
Takže bych si mohla svého neobratně natrénovaného Zámrského OCR prokřížit s kolegovým zburgetovým namakaným OCR a jejich nový potomek by mohl podědit moji krásu a zburgetovu schopnost číst staré texty? Nebo jste je už takhle nějak křížil?

od **zburget** » pon dub 26, 2021 7:52

Já myslím, že ty "oficiální" OCR modely jsou trénované na nějakých "zaručených" sadách, které někdo nějak připravil a "zaručeně" přepsal.
A budou to určitě řádově minimálně desetitisíce řádků.
S tím se tady to naše hraní asi, bohužel, nedá srovnávat :-)

U nás je problém taky v tom, že vlastně nemáme ani přesné instrukce, jak některé věci přepisovat. Já pro svůj testovací latinský dataset vlastn ani nemám kompletní znakovou sadu (protože vím, že třeba zrovna ta pořád zmiňovaná ligatura æ se při přepisech má zapisovat ligaturou a ne rozepisovat, jako ae). Takže věřím, že na úspěšnou obhajobu diplomky to, co je bude bohatě stačit. Výsledky to dává velice dobré.
A jen doufám, že po obhajobě se na tom ještě bude pracovat a budou se opravovat věci, které by teď té obhajobě jen uškodily. Určitě se nemůže měnit znaková sada, určitě se nemůže sahat do jiných kritických míst v OCR. Můžná se můžou opravovat takové ptákoviny, jako editace polygonů, ale na to zřejmě prostě teď není čas.
Musíme si počkat, držet všechny palce, aby obhajova dopadla dobře, a doufat, že se po ní buď autor aplikace sám nebo lépe i ještě někdo další bude věnovat dalšímu vývoji, že bude zapracováno co nejvíc návrhů a nápadů nejen nás, ale i dalších, kdo s tím budou pracovat a taky, že k tomu bude vypracovaný i nějaký metodický materiál, jak ty přepisy přesně dělat. Možná jsou to věci, které jsou historikům všeobecně známé, ale my, laici, to nevíme. A čekat, až k tomu někdo, byť povolanější, dodá dostatečné množství trénovacích dat, se mi úplně nechce. To si ta trénovací data budu radši pomalu vytvářet sám :-)

. Jen to musí mít nějaký řád, abych to nedělal jen sám pro sebe. To by byla škoda práce a času.

od **Davidh** » pon dub 26, 2021 8:10

Zapomněl jsem napsat, že během trénování nových instancí OCR jsem rozšířil i tu trénovací sadu, takže tu Vaši ligaturu už tam máte

od **zburget** » pon dub 26, 2021 8:29

Wow!!! Díky!
Tak to si s tím zase určitě dobře "pohraju". Ještě chci s vaším vedoucím práce trochu probrat ten automatický anotátor. Pak si poupravím řádky, aby to nestříhalo kusy písmen (protože mi to dělá z velkého C závorku "("; z velkého B malé b; p mi to občas ustřihne až na a :-(

). A pustím se do přepisů. Teď po natrénování na těch kronikách je to s latinou úplně totálně vedle. Tak musím začít od začátku. A nechci to trénovat ani na té mojí testovací sadě, protože ta je pravě anotovaná dost blbě.
Ale nějak si s tím poradím :-)

od **matju** » pon dub 26, 2021 9:40

Jo, na tu metodiku transliterace by to chtělo ještě zadat diplomku někomu, kdo studuje paleografii nebo něco podobně zaměřeného..

)

od **Davidh** » pon dub 26, 2021 9:51

Ještě prosím nespouštějte úkoly pro CRNN OCR, jelikož ladím nějaké grafy v práci a potřebuji na těch GPU něco počítat

Během dneška napíšu až budu mít hotovo. Díky.

GENEALOGIE

OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Re: OCR pro rucne psany text s doucovanim

Kdo je online