Optisk teckenigenkänning för svenska







2024-11-14

Vänligen bokmärk den här sidan.



Optisk teckenigenkänning (OCR) är elektronisk eller mekanisk konvertering av bilder av maskinskriven, handskriven eller tryckt text till maskinkodad text, oavsett om det är från ett skannat dokument, ett foto av ett dokument, ett scenfoto (till exempel texten på skyltar och skyltar i ett landskap fotografi), eller från undertext som lagts över en bild (till exempel från en tv-sändning).

Används ofta för att mata in data från tryckta pappersregister – oavsett om det gäller pass, fakturor, kontoutdrag, datoriserade kvitton, visitkort, post, utskrifter av statisk data eller annan lämplig dokumentation – det är en vanlig metod för att digitalisera tryckta texter så att de kan elektroniskt redigeras, sökas, lagras mer kompakt, visas online och användas i maskinprocesser som kognitiv beräkning, maskinöversättning och (extraherad) text-till-sp OCR är ett underområde av mönsterigenkänningsstudier som omfattar artificiell intelligens och datorseende.

Tidigare versioner krävde träning med fotografier av enskilda karaktärer och arbetade på ett enda typsnitt åt gången. Avancerade system som kan leverera en hög grad av identifieringsnoggrannhet för de flesta typsnitt är nu allmänt tillgängliga, liksom system som accepterar ett antal digitala bildfilformat som indata. Vissa system kan replikera formaterad utdata som är så lik originalsidan som möjligt, inklusive grafik, kolumner och andra icke-textuella komponenter.