Annomobiili-ohjelma eli XML2RDF-muunnos *************************************** Koko XML2RDF muunnosprosessia on kaksivaiheinen: 1.Ensin tuotetaan uusista XML korteista tarvittavat uudet termit ja yksilöt Terminaattorin avulla. 2.Tämän jälkeen Annomobiiililla voidaan suorittaa varsinainen XML2RDF muunnos. Molemmissa vaiheissa ihmisen tulee tarkistaa ja täydentää epäselvien tapauksien kohdalla koneen tekemää työtä. Tämä työn avuksi Terminaattori ja Annomobiili lisäävät tuotoksiinsa Asentaminen *********** Annomobiili tarvitsee toimiakseen, että koneeseen on asennettu: 1. Java - JRE1.4 tai uudempi. 2. Jena eli RDF-käsittelijä) - Jena 1.6.1. Jenan voi ladata sivustolta http://www.hpl.hp.com/semweb/jena.htm 3. Xerxes eli XML-parseri Kun nämä on asennettu, Annomobiilin mukana tulevaan setup-tiedostoon (setup_annomobile) pitää lisätä polut Jenaan ja Xercesiin. Asetustiedostoihin (ks. seuraava kohta) pitää myös korjata tiedostopolut. Asetustiedostot *************** Annomobiilla on kolme asetustiedostoa: 1.konfig_range.txt, jossa määritellään juuriresurssit ontologisille ominaisuuksille 2.konfig_tiedosto.txt, jossa annetaan ontologioiden ja termitiedostojen hakemistot, sekä tieto, mihin tiedostoon tulos kirjoitetaan 3.konfig.txt tiedostossa kerrotaan ontologisten ominaisuuksien nimiavaruudet. Ajaminen ******** Annomobiililla on setup_annomobile, joka pitää ajaa ennen annomobiilin ajamista esimerkiksi komennolla: %source setup_annomobile Annomobiili käynnistetään komentoriviltä ja sille annetaan parametrina XML-tiedosto. Käynnistys tapahtuu esimerkiksi näin: %java Annomobiili xmlkortit.xml annolog.txt Annomobiili käsittelee melko suuria tiedostoja joten sille varattu muisti saattaa loppua kesken, jolloin käyttäjä saa virheilmoituksen: "OutOfMemoryError". Tällöin Annomobiilille tulee antaa lisää muistia. Lisämuistin antaminen myös parantaa nopeuttaa. Lisämuistia voi antaa kutsumalla Annomobiilia esimerkiksi seuraavasti: %java -Xmx500m Annomobiili xmlkortit.xml annolog.txt Prosessi ******** Annomobiili lukee sisäänsä ensin ontologiat. Sitten se alkaa parsia XML-tiedostoa käyden sen läpi esineen kerrallaan. Joka esineestä se käy läpi joka elementin ja muodostaa niistä literaaliominaisuuden. Ontologisten ominaisuuksien kohdalla Annomobiili etsii termitiedostoista kaikki termiä vastaavat mahdolliset ontologiaripustukset. Löydettyjen ontologiaripustusten kohdalla tarkistetaan täyttääkö kyseinen ontologiaripustus konf_range-asetustiedostossa määritellyt ripustusrajoitukset. Rajoitusten lisäksi tarkistetaan, ettei ripustuksiin lisätä samaan haaraan kuuluvia ontologiaripustuksia, esimerkiksi ettei lisätä ripustusta kenkiin, jos mukana on myös ripustus korkokenkiin. Mikäli nämä molemmat ehdot ? range-rajoitus ja ei-sama-haara ? täyttyvät, Annomobiili suorittaa ripustuksen. Kun kaikki esinekortit on käyty läpi, Annomobiili kirjoittaa ne tiedostoon, joka on määritelty konf_tiedosto.txt-tiedostossa. Esinekortteihin Annomobiili kirjoittaa lisätietoja annotoinnin helpottamiseksi. Lisätiedoitoihin on kerrottu kaksi asiaa: 1. Monimerkitykselliset termit, eli missä esinekortissa esiintyy monimerkityksellinen sana ja mikä kyseinen sana on. Monimerkityksellisiä tietoja sisältävät kortit kannattaa käydä läpi ja poistaa toinen ripustuksista, koska ne molemmat eivät todennäköisesti ole haluttuja. 2. Termikortittomat termit, eli missä kortissa esiintyy termi, jota vastaavaa termikorttia ei ole tehty. Tällaisia termejä ei pitäisi esiintyä, mikäli Terminaattori on ajettu. Kyseisille termeille on hyvät tehdä vastaava termikortti museon omaan termikorttitiedostoon. Testidata ******** Mukana on testidata, jonka avulla voi testata Annomobiilin toimintaa. Testidata sisältää: 1. testiesinekortin sisältävän XML-tiedoston: testikortit.xml 2. testiesinekortin sisältävän RDF-tiedoston, joka näyttää, millainen tulos on, kun XML-tiedosto on ajettu Annomobiililla: testikortit.rdf