» print this page!
» Follow us on Twitter
» Be our friend on Facebook

Latest News

Latest Publications

SeCo on Twitter

SeCo on Facebook

Akatemiasampo
Historialliset akateemiset henkilöt Suomessa 1640-1899

Projektin tausta

Helsingin yliopiston keskusarkiston alkuperäisaineistoista digitoidut Ylioppilasmatrikkelit sekä lähdeaineistoihin perustavat matrikkelit 1640-1899 sisältävät yksityiskohtaista tietoa n. 28 000 historiallisesta suomalaisesta, käytönnössä kaikista tuon aikakauden akateemisen koulutuksen saaneista henkilöistä maassamme. Pitkälti käsityönä tehty n. 10 henkilötyövuoden suurtyö matrikkelien digitoinnissa, translitteroinnissa ja täydentämisessä kattaa keskeisen osan Suomen ja suomalaisen yliopistolaitoksen historiaa. Suomalaisen Kirjallisuuden Seuran, Suomen Historiallisen Seuran ja muiden tieteellisten seurojen yhteistyönä on puolestaan luotu Kansallisbiografia ja muita biografiakokoelmia, yhteensä 13 144 pienoiselämäkertaa 977 elämäkerturin voimin. Aineisto on ollut saatavilla suurteossarjana ja sitä täydentävinä tietokantoina ja biografiat on nyttemmin julkaistu myös verkkopalveluna. Syksyllä 2018 aineistosta valmistui yhteistyössä Aalto-yliopiston ja Helsingin yliopiston digitaalisten ihmistieteiden keskuksen HELDIG kanssa kieli-, web- ja tekoälyteknologiaa hyödyntävä Biografiasampo-palvelu. Sen kansainvälisenä innovaationa on tarjota lukijalle sisällöllisesti rikastettujen elämäkertojen ohella välineitä data-analyyttistä elämäkerrallista ja prosopografista tutkimusta varten.

Aukeama alkuperäisestä Ylioppilasmatrikkelista 1640-1852

Akatemiasampo-hankkeen tavoitteet

Akatemiasampo-hankkeen tavoitteena on Helsingin yliopiston ylioppilasmatrikkelien 1640-1899 rikastaminen niihin liittyvien muiden aineistojen avulla ja julkaiseminen älykkäänä Biografiasammon kaltaisena avoimena verkkopalveluna. Palvelu on tarkoitettu tutkijoiden, yliopistolaisten ja laajemman yleisön käytettäväksi ja hyödynnettäväksi tutkimushankkeissa ja uusien sovellusten kehittämisessä. Akatemiasampo luo kuvaa omasta historiastaan ylpeästä, teknisesti edistyneestä suomalaisesta yliopistolaitoksesta digitaalisten ihmistieteiden keinoin. Järjestelmän kehittämiseen sisältyy omaa metodologista mielenkiintoa: siinä tutkitaan eri lähteistä saatavien henkilähistoriallisten aineistojen yhdistämistä. Nämä voivat olla sisällältään toisiaan täydentäviä, päällekkäisiä, ristiriitaisia tai puutteellisia. Keskeistä lähdekriittisen tutkimuskäytön kannalta on tällöin eri lähteiden provenienssitiedon hallinta dataa yhdistettäessä (data fusion). Henkilöhistorialliset tiedot ovat myös voimakkaasti kontekstualisoitua paikan ja ajan suhteen, mihin tarvitaan omia mekanismejaan. Esimerkiksi henkilän puoliso- ja ammatti voivat muuttua ajan mukaan. Oman ongelma-alueensa muodostaa henkilöiden kuvailuissa tarvittavat historialliset sanastot ja käsitteistöt, kuten ammatit ja organisaatiot, jotka vaativat omat ontologiset määrittelynsä. Esimerkiksi Biografia- ja Sotasampo-järjestelmien aineistoissa on käytässä tuhansia historiallisia ammatti- ja arvonimikkeitä, ja Akatemiasammon aineistoista niitä on löytynyt yli 10 000.

Tulokset

Hankkeessa luodaan Ylioppilasmatrikkelin eri tietokantojen ja Biografiasammon aineistojen avulla perusta kansalliselle historiallisten henkilöiden ontologialle ja tunnisteille (URI), jota kautta henkilöihin eri lähteissä liittyvä tieto voidaan yhdistää. Aineistoa voidaan rikastaa mm. muistiorganisaatioiden kokoelmatietojen kautta mukaan lukien Yliopistomuseon aineistot, Kansallisbibliografia Fennica, Valtion taidemuseon kokoelmat, Museoviraston Finna.fi ja yleisten kirjastojen Kirjasampo.fi. Tulos julkaistaan avoimena linkitetyn datan palveluna Linked Data Finland -alustalla. Ontologiatyön lähtäkohtana on samantyyppinen, yhteentoimiva ratkaisu ja verkkopalvelu kuin yhdysvaltalaisen Getty-säätiön avoimen datan ULAN-järjestelmässä, jossa on jo mukana n. 1000 suomalaista. Näin muodostuisi yhteys suomalaisista henkilöistä kansainväliseen kontekstiin. Hankkeemme uutuutena ULAN:iin nähden on kuitenkin datan yhdistäminen eri aineistoista, ja että ontologian hyädyntämistä tuetaan kehittämällä sille käyttäliittymäsovellus tutkijoiden ja laajemman yleisän tarpeisiin, eräänlainen 'henkilöhistorioitsijan työpöytä'. Samalla rikastetaan Biografiasammon aineistoja matrikkeli- ja kokoelmadatalla, mitä on erityisesti toivottu biografiatutkijoiden toimesta. Työssä voidaan hyödyntää Biografiasammossa jo tehtyjä teknisiä ratkaisuja.

Muita semanttisen webin "sampoja" verkossa

Semanttisen laskennan tutkimusryhmä (SeCo) on julkaissut verkossa useita digitaalisten ihmistieteiden "sampoja" tutkijoiden ja laajemman yleisön käytettäväksi:

Kehitteillä ja valmistumassa on myös Löytösampo (arkeologia ja kansalaistiede), Lakisampo (oikeusministeriön Semanttinen Finlex -lakiaineistoihin liittyen) ja Sotasurmasampo 1914-1922 (sisällissodan, 1. maailmansodan ja heimosotien aineistot).

'Sampojen' metodologisena perustana on semanttisen webin teknologioihin ja linkityn datan ideaan perustuva 'Sampo-malli'.

A Video about AcademySampo

Yhteyshenkilöt ja projektiryhmä SeCossa

Prof. Eero Hyvönen,
Aalto-yliopisto ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities

DI Petri Leskinen,
Aalto-yliopisto, tietotekniikan laitos

FM Heikki Rantala,
Aalto-yliopisto, tietotekniikan laitos


Julkaisuja

2020

Eero Hyvönen: Sampo Model and Semantic Portals for Digital Humanities on the Semantic Web. DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, pp. 373-378, CEUR Workshop Proceedings, vol. 2612, Riga, Latvia, October, 2020. bib pdf link
Petri Leskinen and Eero Hyvönen: Linked Open Data Service about Historical Finnish Academic People in 1640–1899. DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, pp. 284-292, CEUR Workshop Proceedings, vol. 2612, Riga, Latvia, October, 2020. bib pdf link
Eero Hyvönen: Tekoäly ja semanttinen web tarjoavat huikeat mahdollisuudet suurten aineistojen hallintaan. Kansallisarkiston strategia 2025, näkökulmia tulevaan (Jussi Nuorteva, Päivi Happonen (ed.)), pp. 20-21, Kansallisarkisto, Helsinki, May, 2020. bib link
Eero Hyvönen: Semantic Sampo Portals for Digital Humanities Based on a National Linked Open Data Infrastructure. Proceedings of the Digital Humanities in the Nordic Countries. 5th Conference, CEUR Workshop Proceedings, 2020. Vol-2612. bib pdf link

2018

Eero Hyvönen: Semanttinen web. Linkitetyn avoimen datan käsikirja (Semantic Web. Handbook of Linked Open Data). pp. 271, Gaudeamus, Helsinki, Finland, March, 2018. bib link
/var/www/html/include/secoweb/utils.php; Sat, 28 Nov 2020 08:40:58 +0000