PRUMYSL.CZ KONSTRUKTER.CZ 3D-TISK.CZ MATEMATIKA.CZ HLEDAME.CZ

Siemens usnadní prohledávání naskenovaných dat

Desítky let staré dokumenty, psané zpravidla na psacích strojích a doplněné různými poznámkami, procházejí digitalizací. Siemens vyvíjí program, který má výrazně usnadnit vyhledávání v těchto datech i bez náročné rešerše.

Do digitální podoby se převádějí historické dokumenty, středověké archiválie i záznamy z katastru nemovitostí. Mívají často přes tisíc stránek a mohou navíc obsahovat stejný druh informací i vícekrát – v závislosti na tom, jak se dodatečně upravovalo zadání projektu. Vyhledávání proto funguje tak, že automaticky zobrazuje i změny, ke kterým došlo v souvislosti s hledaným tématem i ve starších dokumentech.

Převést miliony stran dokumentů do digitální podoby není až tak komplikované, jak by se mohlo zdát – automatické skenery jsou schopné naskenovat až 2000 stran za hodinu. Orientace a následné vyhledávání v milionech elektronických stránek je podstatně větší výzvou, vyžadující pokročilé algoritmy pro analýzu obrazu. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz

Převést miliony stran dokumentů do digitální podoby není až tak komplikované, jak by se mohlo zdát – automatické skenery jsou schopné naskenovat až 2000 stran za hodinu. Orientace a následné vyhledávání v milionech elektronických stránek je podstatně větší výzvou, vyžadující pokročilé algoritmy pro analýzu obrazu. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz

Cílem tvůrců programu je začlenit do programu základy sémantiky a umožnit automatické vyhledávání příbuzných témat ve starších dokumentech. Uživatel by tak mohl ihned vyhledat veškeré potenciálně zajímavé informace bez časově náročné rešerše.

Práce s dokumenty v digitální podobě dokáže oproti ručnímu procházení stohů papíru ušetřit spoustu času, podmínkou jsou však propracované systémy pro vyhledávání. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz

Práce s dokumenty v digitální podobě dokáže ušetřit spoustu času oproti ručnímu procházení stohů papíru. Podmínkou jsou však propracované systémy pro vyhledávání. Foto: Siemens/Bayerische Staatsbibliothek/H.-R. Schulz

Program byl původně určen pro snazší orientaci právě v datech z katastru nemovitostí. V budoucnu se očekává vývoj podobného programu, který by vyhledával v dokumentech zaměřených na právo nebo medicínu. Vyhledávání judikatur nebo diagnóz vzácných onemocnění by pak bylo otázkou několika minut.

Mohlo by vás také zajímat

Přidejte k článku svůj komentář

Komentář podléhá autorizaci ze strany redakce, proto se nezobrazí ihned po vložení. Vyhrazujeme si právo odstranit příspěvky, které jsou v rozporu s dobrými mravy nebo platnou legislativou. Slušnou a konstruktivní diskusi vítáme!