Terminaattori-ohjelma ********************* Terminaattoritiedosto tuottaa uusia termikortteja museokokoelmien tietoja sisältävistä XML-korteista. Semanttisessa yhdistämisessä kaikkia museoesineen kokelmatietoja ei ripusteta ontologioihin, vaan vain valitut tapaukset. Ripustettavat tiedot, ns. ontologiset ominaisuudet, ripustetaan aina tiettyyn ontologiaan. Näistä ontologisista ominaisuuksista tulee tehdä termikortit, jotta ontologinen ripustaminen onnistuu. Asentaminen *********** Terminaattori tarvitsee toimiakseen, että koneeseen on asennettu: 1. Java - JRE1.4 tai uudempi. 2. Jena eli RDF-käsittelijä) - Jena 1.6.1. Jenan voi ladata sivustolta http://www.hpl.hp.com/semweb/jena.htm 3. Xerxes eli XML-parseri Kun nämä on asennettu, Terminaattorin mukana tulevaan setup-tiedostoon (setup_terminator) pitää lisätä polut Jenaan ja Xercesiin. Asetustiedostoihin (ks. seuraava kohta) pitää myös korjata tiedostopolut. Asetustiedostot *************** Terminaattorilla on asetustiedosto konfig_X.txt, jossa X =mao, toimijat, paikat, kokoelmat. Asetustiedostossa kerrotaan viisi asiaa: 1.XML-kortin tutkittavien ominaisuuksien nimet (esim. valmistaja ja kayttaja) 2.MuseoSuomen globaali termikorttitiedosto Xtermit.rdf 3.Museon paikallinen termikorttitiedosto Xtermit_omaMuseo.rdf 4.Termikorttitiedoston nimiavaruus, esimerkiksi http://www.cs.helsinki.fi/group/seco/ns/2004/03/18-terms# 5.Selite, jonka haluaa uusiin termikortteihin, esimerkiksi oman museon nimi ja päivämäärä. Ajaminen ******** Terminaattorilla on setup_terminator, joka pitää ajaa ennen Terminaattorin ajamista esimerkiksi komennolla: %source setup_terminator Terminaattoriohjelma käynnistetään komentoriviltä ja sille annetaan parametrina XML-tiedosto sekä asetustiedosto. Käynnistys tapahtuu esimerkiksi näin: %java Terminaattori xmlkortit.xml konfig_toimijat.txt Terminaattori käsittelee melko suuria tiedostoja joten sille varattu muisti saattaa loppua kesken, jolloin käyttäjä saa virheilmoituksen: "OutOfMemoryError". Tällöin Terminaattorille tulee antaa lisää muistia. Lisämuistin antaminen myös parantaa nopeuttaa. Lisämuistia voi antaa kutsumalla Terminaattoria esimerkiksi seuraavasti: %java -Xmx500m Terminaattori xmlkortit.xml Toiminta ******** Terminaattoriohjelma erottaa XML-tiedostosta uudet termikandidaatit, luo niistä tyhjät termikortit, ja esitäyttää termikortit. Terminaattoriohjelma tunnistaa tuntemattomat termit vastaavissa XML-elementeissä eli toisin sanoen sellaiset termit, joista ei ole jo termikorttia olemassa. Tunnistuksen jälkeen uusia termejä vastaavat puoliksi täytetyt termikortit lisätään museon omiin termikortteihin luokan "tuntematon" instansseiksi. Esitäytössä termille luodaan uri, alkuperäismuotoinen ilmaisu talletetaan ja kommentiksi asetetaan tieto siitä, mistä kentästä termi on erotettu. Terminaattorin tulosteena on kyseiset yllä mainityt esitäytetyt uudet termikortit. Nämä uudet lisätään vanhojen museon omien eli lokaalien termien seuraksi tiedostoon XTermit_omaMuseo.rdf ihmisen edelleen toimitettavaksi ohjetiedoston avulla. Esitäytettyjen termikorttien niissä olevien kommenttien perusteella ihmistoimittaja osaa tehdä tarvittavat korjaukset ja päättää, mitkä termit asetetaan etusijalle. Ajatuksena on, että ihmiseditori täydentään vajavaisten termikorttien viittaukset vastaavan skeeman mukaiseen ontologiaan ja siirtää valmiin kortti-instanssin lopuksi oikeaan paikkaan luokan "Terms" alle. Ohjelman ajo voidaan suorittaa uudelleen uusilla parametreilla tai uudella XML-tiedostolla, kunnes ei synny uusia instansseja, eli kaikki termit on tunnistettu. Testidata ******** Mukana on testidata, jonka avulla voi testata Terminaattorin toimintaa. Testidata sisältää: 1. testiasetustiedoston: testikonfig_mao.txt 2. testiesinekortin sisältävän XML-tiedoston: testikortit.xml 3. suppean testiversion globaaleis tatermeistä: testitermitiedosto_maoTermit.rdf 4. suppean testiversion lokaaleista termeistä: testitermitiedosto_maoTermit_omaMuseo.rdf 5. Protege-katselua varten rdfs- ja pprj-tiedostot lokaaleista termeistä: testitermitiedosto_maoTermit_omaMuseo.rdfs ja testitermitiedosto_maoTermit_omaMuseo.pprj