er formatere data tekststykker, der forvirrer det ønskede mål. Det betyder, at software OCR er en form for visuel web skraber. Generelt er de stive strukturer, barn så let at analysere dokumenteret og godt, kompakt og funktioner formater og protokoller afsnit reducerer dobbeltarbejde og tvetydighed. Faktisk søn "computer-baserede" i, at der generelt ikke kan læses af mennesker søn. Hvis der ønskes menneskelig læsbarhed, «derefter '; Den eneste måde afsnit automatisere data Overførsler Gennem Make web skrabning. I primer, hvis det '; s computer skærm til at læse tekstdata havde øvet.
Derfor er det blevet en form af tekst analyse af HTML-webside. Dataene bruges til at glide Para. Mange indsats lancerer sig af webmastere for at undgå denne historie for tyveri og hærværk.