Exjobbsförslag från företag

Detta är ett uppsatsförslag hämtat från Nationella Exjobb-poolen. Klicka här för att komma tillbaka till samtliga exjobbsförslag.

Förslaget inkom 2006-02-08

Analys och presentation av stora XML-filer.

OBS! ANSÖKNINGSTIDEN FÖR DETTA EXJOBB HAR LÖPT UT.
Det har på senare tid blivit mycket populärt att använda XML för
lagring och utbyte av data. XML-formatet erbjuder strukturering av
data men också en flexibilitet och öppenhet som gör det lämpligt för att
representera allt från mycket välstrukturerad data till en enkel
uppmarkering av en text. Nya standarder baserade på XML för
datarepresentation inom olika domäner utvecklas snabbt.

Den här utvecklingen har lett till en situation där det ofta finns
många olika XML standarder för representation av liknande data inom en
domän. Dessutom finns oftast data som bara delvis eller inte alls
följer de här standarderna. Det här gör det svårt för en användare att
enkelt avgöra om en datamängd är av intresse för honom och sedan
använda hela eller delar av datamängden på något sätt. I exjobbet
kommer vi att förutsätta att användaren kan beskriva strukturen på den
data han är intresserad av och vi vill jämföra dennastruktur med en
okänd XMl-fil.

Examensarbetet består av tre delar:

- En studie av existerande metoder som finns för att analysera
och jämföra strukturer hos XML-filer och databaser. Här är
vi intressearde av både användarstödda och helautomatiska
metoder.

- Implementation av ett verktyg som kan hjälpa användaren att avgöra
om en XML-fil är av intresse och hjälpa användaren att på
något sätt ange vilka delar av filen som han vill arbeta vidare med.

- Utvärdering av verktyget på data inom bioinformatik (molekylära
signalvägar). Eventuellt kan man även använda data från en annan
domän.

Nivå: D
Ämnesområde: Datalogi
Lämpligt program: Civilingenjör eller motsvarande med inriktning mot data.



  GÅ TILL XJOBB.NU FÖR FULLSTÄNDIG INFO OM DETTA EXJOBB




Informationen om uppsatsförslag är hämtad från Nationella Exjobb-poolen.