» back to normal layout
Akatemiasampo
Akateemiset henkilöt Suomessa 1640-1899

Projektin tausta

Helsingin yliopiston keskusarkiston alkuperäisaineistoista digitoidut Ylioppilasmatrikkelit 1640-1899 sisältävät yksityiskohtaista tietoa yli 28 000 historiallisesta suomalaisesta, kaikista tiedossa olevista tuona aikana Suomessa akateemisen koulutuksen saaneista henkilöistä, sillä muita yliopistoja ei Suomessa tuolloin ollut. Aineisto kattaa keskeisen osan Suomen ja suomalaisen yliopistolaitoksen historiaa. Suomalaisen Kirjallisuuden Seuran, Suomen Historiallisen Seuran ja muiden tieteellisten seurojen yhteistyönä on puolestaan luotu Kansallisbiografia ja muita biografiakokoelmia, yhteensä 13 144 pienoiselämäkertaa 977 elämäkerturin voimin. Aineisto on ollut saatavilla suurteossarjana ja biografiat on nyttemmin julkaistu myös verkkopalveluna ja semanttisena portaalina ja avoimena datapalveluna Biografiasampo. Akatemiasampo soveltaa ja kehittää edelleen Biografiasammossa ja muissa Sampo-portaaleissa luotua semanttisen laskennan teknologiaa digitaalisissa ihmistieteissä uudella, historiallisiin akateemisiin henkilöihin liittyvällä aineistolla.

Akatemiasammon pääaineistona oleva alkuperäinen ylioppilasmatrikkeliaineisto on translitteroitu ja digitoitu käsityönä tietokannaksi laajassa hankkeessa ja siihen on lisätty samalla runsaasti tietoa ylioppilaiden myöhemmistä elämänvaihesta. Kyseessä on ollut n. 10 henkilötyövuoden urakka, jonka vetäjinä ovat olleet Yrjö Kotivuori Kansallisarikstosta ja Veli-Matti Autio Helsingin yliopiston arkistosta. Tietokannan aineisto on ollut haettavissa ja luettavissa Helsingin yliopiston keskusarkiston toimesta verkossa vuodesta 2005, mutta se ei ole ollut käytettävissä avoimena datana digitaalisten ihmistieteiden tutkimuksia varten eikä aineistojen tutkimiseen ole ollut tarjolla kehittyneitä haku-, selailu- ja data-analyysin työkaluja.

Aukeama Ylioppilasmatrikkelin henkilöhakemistosta Index

Akatemiasampo-hankkeen tavoitteet

Akatemiasampo-hankkeen tavoitteena on Helsingin yliopiston ylioppilasmatrikkelien 1640-1899 rikastaminen niihin liittyvien muiden henkilöhistoriallisten aineistojen avulla ja julkaiseminen älykkäänä Biografiasammon kaltaisena semanttisena portaalina ja linkitetyn avoimen datan palveluna. Palvelu on tarkoitettu tutkijoiden, yliopistolaisten ja laajemman yleisön käytettäväksi ja hyödynnettäväksi tutkimushankkeissa ja uusien sovellusten kehittämisessä. Akatemiasampo luo kuvaa omasta historiastaan ylpeästä, teknisesti edistyneestä suomalaisesta yliopistolaitoksesta digitaalisten ihmistieteiden keinoin. Palvelun innovaationa on tarjota lukijalle sisällöllisesti rikastettujen elämäkertojen ohella välineitä data-analyyttistä elämäkerrallista ja prosopografista tutkimusta varten. Järjestelmän kehittämiseen sisältyy myös omaa metodologista mielenkiintoa: siinä tutkitaan mm. tekstuaalisten matrikkelitietojen entiteettien (henkilöt, paikat jne.) ja käsitteiden tunnistamista ja tekstin rakenteistamista linkitetyksi dataksi, mikä mahdollistaa erilaisten data-analyyttisten työkalujen kehittämisen ja soveltamisen.

Oma tutkimusalueensa on eri lähteistä saatavien henkilöhistoriallisten aineistojen yhdistämisen tutkimus. Aineistot voivat olla sisällöltään toisiaan täydentäviä, päällekkäisiä, ristiriitaisia tai puutteellisia. Keskeistä lähdekriittisen tutkimuskäytön kannalta on tällöin eri lähteiden provenienssitiedon hallinta dataa yhdistettäessä (data fusion) ja datalukutaito (data literacy). Henkilöhistorialliset tiedot ovat kontekstualisoituja paikan ja ajan suhteen ja data-analyysien tulkinta puutteellisen, tilastollisesti painottuneen tai osin virheellisen tiedon avulla vaatii uudenlaista aineistojen luonteen ymmärtämistä tutkijalta. Esimerkiksi henkilön puoliso-, nimi ja ammatti voivat muuttua ajan mukaan. Oman ongelma-alueensa muodostaa henkilöiden kuvailuissa tarvittavat historialliset sanastot ja käsitteistöt, kuten ammatit ja organisaatiot, jotka vaativat omat ontologiset määrittelynsä. Esimerkiksi Biografia- ja Sotasampo-järjestelmien aineistoissa on käytössä tuhansia historiallisia ammatti- ja arvonimikkeitä, ja Akatemiasammon aineistoista niitä on löytynyt yli 10 000.

Tulokset: Akatemiasampo-portaali ja linkitetyn avoimen datan palvelu

Akatemiasampo-hankkeen tuloksena on kehitetty:

  1. Semanttinen portaali Akatemiasampo.fi, joka on uusi jäsen Sampo-portaalien sarjassa. Portaali on tarkoitattu kaikille henkilöhistoriasta ja prosopografiasta kiinnostuneille tutkijoille ja kansalaisille, eikä sen hakukoneiden ja data-analyyttisten työkalujen käyttö edellytä ohjelmointitaitoa.
  2. Linkitetyn avoimen datan palvelu CC-BY-4.0-linsenssillä Linked Data Finland -alustalla. Tämä Akatemiasampo-portaalin perustana oleva datapalvelu on tarkoitattu digitaalisten ihmistieteiden tutkijoille käyttämällä esimerkiksi YASGUI-työkalua ja SPARQL-kyselyitä tai Google Colab / Jupyter-dokumentteja. Akatemiasammon data on vapaasti käytettävissä sovellusten kehittäjille. Akatemiasampo-portaali on demonstraatio tästä mahdollisuudesta: se on toteutettu ainoastaan LDF.fi-palvelun tarjoaman SPARQL-rajapinnan varaan; käyttöliittymä ohjelmoitiin Sampo-UI-ohjelmointikehyksen avulla.

Molempia palveluita samoin kuin Akatemiasammon visiota ja taustoja on esitelty julkistustilaisuudessa 5.2.2021.

Akatemiasammon käyttö

Akatemiasampo-portaalin ja datapalvelun käyttöä on esitelty tarkemmin artikkelissa:

Akatemiasammon käyttö henkilöiden ja henkilöryhmien historiallisessa tutkimuksessa

Linkitetyn avoimen datan tietoinfrastruktuuri ja Sampo-portaalit

Akatemiasampo kuuluu digitaalisten ihmistieteiden linkitetyn avoimen datan infrastruktuuriin Suomessa (LODI4DH), joka on osa Suomen Akatemian tiekartalla olevaa digitaalisten ihmistieteiden tietoinfrastruktuuria FIN-CLARIAH.

Akatemiasampo luo osaltaan perustaa kansalliselle historiallisten henkilöiden ontologialle ja tunnisteille (URI), jota kautta henkilöihin eri lähteissä liittyvä tieto voidaan yhdistää. Aineistoa voidaan rikastaa mm. muistiorganisaatioiden kokoelmatietojen kautta mukaan lukien Yliopistomuseon aineistot, Kansallisbibliografia Fennica, Valtion taidemuseon kokoelmat, Kansalliakirjaston Finna.fi ja yleisten kirjastojen Kirjasampo.fi. Ontologiatyön tavoitteena on samantyyppinen, yhteentoimiva ratkaisu ja verkkopalvelu kuin yhdysvaltalaisen Getty-säätiön linkitetyn avoimen datan ULAN-tesaurus, jossa on jo mukana n. 1000 suomalaista. Näin muodostuu yhteys suomalaisista henkilöistä kansainväliseen kontekstiin. Hankkeemme uutuutena ULAN:iin nähden on kuitenkin datan yhdistäminen eri aineistoista, ja että ontologian hyödyntämistä tuetaan kehittämällä sille käyttäliittymäsovellus tutkijoiden ja laajemman yleisän tarpeisiin, eräänlainen 'henkilöhistorioitsijan työpöytä'. Samalla rikastetaan Biografiasammon aineistoja matrikkeli- ja kokoelmadatalla, mitä on erityisesti toivottu biografiatutkijoiden toimesta. Työssä voidaan hyödyntää Biografiasammossa jo tehtyjä teknisiä ratkaisuja.

Muita semanttisen webin "sampoja" verkossa

Semanttisen laskennan tutkimusryhmä (SeCo) on julkaissut verkossa useita digitaalisten ihmistieteiden "sampoja" tutkijoiden ja laajemman yleisön käytettäväksi kuten:

Kehitteillä ja valmistumassa on myös Löytösampo (arkeologia ja kansalaistiede), Lakisampo (oikeusministeriön Semanttinen Finlex -lakiaineistoihin liittyen) ja Parlamenttisampo (eduskunnan aineistoihin liittyen).

'Sampojen' metodologisena perustana on semanttisen webin teknologioihin ja linkityn datan ideaan perustuva 'Sampo-malli' ja Sampo-UI ohjelmointikehys käyttöliittymien toteuttamista varten.

Videoita Akatemiasammosta

Alla olevat lyhyet videot antavat yleiskuvan Akatemiasampo-hankkeesta, Akatemiasammon avoimesta datapalvelusta, Akatemiasampo.fi-portaalista ja näiden käytöstä tutkimuksessa:

hyvonen-akatemiasampo-2021-02-05 from SeCo Research Group on Vimeo.

Yhteistyökumppanit

Akatemiasampo on toteutettu Aalto-yliopistossa yhteistyössä Helsingin yliopiston digitaalisten ihmistieteiden keskuksen HELDIG ja Helsingin yliopiston arkiston ja kirjaamon Arkki kanssa.

Yhteyshenkilöt ja projektiryhmä SeCossa

Prof. Eero Hyvönen (vetäjä),
Aalto-yliopisto, tietotekniikan laitos, ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities

DI Petri Leskinen,
Aalto-yliopisto, tietotekniikan laitos

FM Heikki Rantala,
Aalto-yliopisto, tietotekniikan laitos

DI Esko Ikkala,
Aalto-yliopisto, tietotekniikan laitos

TkT Jouni Tuominen,
Aalto-yliopisto, tietotekniikan laitos, ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities


Julkaisuja

2021

Petri Leskinen and Eero Hyvönen: Reconciling and Using Historical Person Registers as Linked Open Data in the AcademySampo Knowledge Graph. Proceedings of the 20th International Semantic Web Conference (ISWC 2021), Springer, October, 2021. Forth-coming. bib pdf
Petri Leskinen and Eero Hyvönen: Using the AcademySampo Portal and Data Service for Biographical and Prosopographical Research in Digital Humanities. Proceedings of the 20th International Semantic Web Conference (ISWC 2021), Posters and Demos, Oct, 2021. Forth-coming. bib pdf
Eero Hyvönen, Petri Leskinen, Heikki Rantala, Esko Ikkala and Jouni Tuominen: Akatemiasampo-portaali ja -datapalvelu henkilöiden ja henkilöryhmien historialliseen tutkimukseen (AcademySampo Portal and Data Service for Biographical and Prosopographical Research). Informaatiotutkimus, vol. 40, no. 2, pp. 28-56, May, 2021. bib pdf link
Esko Ikkala, Eero Hyvönen, Heikki Rantala and Mikko Koho: Sampo-UI: A Full Stack JavaScript Framework for Developing Semantic Portal User Interfaces. Semantic Web – Interoperability, Usability, Applicability, April, 2021. Accepted. bib pdf link

2020

Eero Hyvönen: Semantic Sampo Portals for Digital Humanities Based on a National Linked Open Data Infrastructure. 2020. White paper, Aalto University, Semantic Computing Research Group (SeCo). bib pdf
Eero Hyvönen: Sampo Model and Semantic Portals for Digital Humanities on the Semantic Web. DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, pp. 373-378, CEUR Workshop Proceedings, vol. 2612, Riga, Latvia, October, 2020. bib pdf link
Petri Leskinen and Eero Hyvönen: Linked Open Data Service about Historical Finnish Academic People in 1640–1899. DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, pp. 284-292, CEUR Workshop Proceedings, vol. 2612, Riga, Latvia, October, 2020. bib pdf link
Eero Hyvönen: Tekoäly ja semanttinen web tarjoavat huikeat mahdollisuudet suurten aineistojen hallintaan. Kansallisarkiston strategia 2025, näkökulmia tulevaan (Jussi Nuorteva, Päivi Happonen (ed.)), pp. 20-21, Kansallisarkisto, Helsinki, May, 2020. bib link

2018

Eero Hyvönen: Semanttinen web. Linkitetyn avoimen datan käsikirja (Semantic Web. Handbook of Linked Open Data). pp. 271, Gaudeamus, Helsinki, Finland, March, 2018. bib link
/var/www/html/include/secoweb/utils.php; Mon, 20 Sep 2021 04:59:26 +0000