Exjobbsförslag från företag

Detta är ett uppsatsförslag hämtat från Nationella Exjobb-poolen. Klicka här för att komma tillbaka till samtliga exjobbsförslag.

Förslaget inkom 2011-03-23

Kontextstyrd tröskling och bildfiltrering för optimal OCR

OBS! ANSÖKNINGSTIDEN FÖR DETTA EXJOBB HAR LÖPT UT.
Om företaget
ReadSoft Lab - Capture Solutions utvecklar programvara för automatisk datafångst. I vår produktportfölj finns bland annat INVOICES som är världens mest använda programvara för datafångst på fakturor.

Bakgrund
OCR utförs traditionellt på svartvit (bitonal) bitmap.Tolkningsgraden är normalt mycket hög om bitmappen har tillräckligt god kvalitet. Dålig kvalitet på originalmaterialet, varierande tryck och bakgrundsraster är några exempel på orsaker till att OCR-resultaten ibland kan försämras. Oftast kan man i de situationerna förbättra kvaliteten på bitmappen genom att justera parametrar i metoden som genererar bitmappen eller helt enkelt byta till en annan metod som bättre lämpar sig för den aktuella bilden. Andra alternativ är att applicera bildförbättringsalgoritmer på indata till metoden eller applicera olika bildfiler för att förbättra den genererade bitmappen.

Att alltid prova många olika varianter av förbehandling, olika parameterinställningar och olika efterbearbetningar och jämföra OCR-resultaten för att hitta den bästa kombinationen till den aktuella bilden är för beräkningskrävande. En möjlig lösning är att istället låta en ”meta-algoritm” övervaka både indata och OCR-resultat och gå in och ändra såväl parametrar som metoder för att alltid säkra hög tolkningsgrad.

Uppgift
Examensarbetet består av att utreda olika metoder för att förbättra OCR-resultat genom bra val av konverteringsparametrar för tröskling till svartvit (bitonal) bild och bra val av bildfilter. De olika valen skall ske automatiskt och styras av analys av bildkvalitet såväl som återkoppling från OCR-resultatet. Metoderna undersöks och utvärderas med avseende på OCR-resultat och hastighet.

Utbilding
Civilingenjör D, Y, E eller motsvarande, alternativt matematisk utbildning med inriktning mot datavetenskap och numeriska metoder. Lämpliga förkunskaper: Goda teoretiska (och gärna praktiska) kunskaper inom relevanta områden som bild- och signalbehandling, data- och bildanalys, numeriska metoder, programmering (gärna C++ och/eller C#). Antal studenter: 1-2.

Kontaktperson
Håkan Bårman, 0733-378641
hakan.barman@readsoft.com

Ansökan
Till ansökan bifogas CV, personligt brev och betygsutdrag. Ansökan skickas till maria.ronnmark@readsoft.com.


  GÅ TILL XJOBB.NU FÖR FULLSTÄNDIG INFO OM DETTA EXJOBB




Informationen om uppsatsförslag är hämtad från Nationella Exjobb-poolen.