Desítky let staré dokumenty, psané zpravidla na psacích strojích a doplněné různými poznámkami, procházejí digitalizací. Siemens vyvíjí program, který má výrazně usnadnit vyhledávání v těchto datech i bez náročné rešerše.

Do digitální podoby se převádějí historické dokumenty, středověké archiválie i záznamy z katastru nemovitostí. Mívají často přes tisíc stránek a mohou navíc obsahovat stejný druh informací i vícekrát – v závislosti na tom, jak se dodatečně upravovalo zadání projektu. Vyhledávání proto funguje tak, že automaticky zobrazuje i změny, ke kterým došlo v souvislosti s hledaným tématem i ve starších dokumentech.

Převést miliony stran dokumentů do digitální podoby není až tak komplikované, jak by se mohlo zdát – automatické skenery jsou schopné naskenovat až 2000 stran za hodinu. Orientace a následné vyhledávání v milionech elektronických stránek je podstatně větší výzvou, vyžadující pokročilé algoritmy pro analýzu obrazu. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz
Převést miliony stran dokumentů do digitální podoby není až tak komplikované, jak by se mohlo zdát – automatické skenery jsou schopné naskenovat až 2000 stran za hodinu. Orientace a následné vyhledávání v milionech elektronických stránek je podstatně větší výzvou, vyžadující pokročilé algoritmy pro analýzu obrazu. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz

Cílem tvůrců programu je začlenit do programu základy sémantiky a umožnit automatické vyhledávání příbuzných témat ve starších dokumentech. Uživatel by tak mohl ihned vyhledat veškeré potenciálně zajímavé informace bez časově náročné rešerše.

Práce s dokumenty v digitální podobě dokáže oproti ručnímu procházení stohů papíru ušetřit spoustu času, podmínkou jsou však propracované systémy pro vyhledávání. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz
Práce s dokumenty v digitální podobě dokáže ušetřit spoustu času oproti ručnímu procházení stohů papíru. Podmínkou jsou však propracované systémy pro vyhledávání. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz

Program byl původně určen pro snazší orientaci právě v datech z katastru nemovitostí. V budoucnu se očekává vývoj podobného programu, který by vyhledával v dokumentech zaměřených na právo nebo medicínu. Vyhledávání judikatur nebo diagnóz vzácných onemocnění by pak bylo otázkou několika minut.

Komentáře