- FIN-CLARIAH Research Infrastructure
A new national research infrastructure initiative FIN-CLARIAH for...
8.12.2021 8:12 by eahyvone - WarMemoirSampo published on December 3, 2021
A new “Sampo” application, “WarMemoirSampo”...
8.12.2021 8:04 by eahyvone - Five new SeCo papers accepted for the ISWC 2021
The 20th International Semantic Web Conference (ISWC 2021), the...
2.8.2021 6:53 by eahyvone
- Eljas Oksanen, Frida Ehrnsten, Heikki Rantala and Eero Hyvönen: Semantic Solutions for Democratising Archaeological and Numismatic Data Analysis
- Annastiina Ahola, Lilli Peura, Rafael Leal, Heikki Rantala and Eero Hyvönen: Using generative AI and LLMs to enrich art collection metadata for searching, browsing, and studying art history in Digital Humanities
- Eero Hyvönen, Patrik Boman, Heikki Rantala, Annastiiina Ahola and Petri Leskinen: ConfermentSampo - A Knowledge Graph, Data Service, and Semantic Portal for Intangible Academic Cultural Heritage 1643-2023 in Finland
- Petri Leskinen: Modeling and Using Biographical Linked Data for Prosopographical Data Analysis
Akatemiasampo
Akateemiset henkilöt Suomessa 1640-1899 |
Projektin tausta
Helsingin yliopiston keskusarkiston alkuperäisaineistoista digitoidut Ylioppilasmatrikkelit 1640-1899 sisältävät yksityiskohtaista tietoa yli 28 000 historiallisesta suomalaisesta, kaikista tiedossa olevista tuona aikana Suomessa akateemisen koulutuksen saaneista henkilöistä, sillä muita yliopistoja ei Suomessa tuolloin ollut. Aineisto kattaa keskeisen osan Suomen ja suomalaisen yliopistolaitoksen historiaa. Suomalaisen Kirjallisuuden Seuran, Suomen Historiallisen Seuran ja muiden tieteellisten seurojen yhteistyönä on puolestaan luotu Kansallisbiografia ja muita biografiakokoelmia, yhteensä 13 144 pienoiselämäkertaa 977 elämäkerturin voimin. Aineisto on ollut saatavilla suurteossarjana ja biografiat on nyttemmin julkaistu myös verkkopalveluna ja semanttisena portaalina ja avoimena datapalveluna Biografiasampo. Akatemiasampo soveltaa ja kehittää edelleen Biografiasammossa ja muissa Sampo-portaaleissa luotua semanttisen laskennan teknologiaa digitaalisissa ihmistieteissä uudella, historiallisiin akateemisiin henkilöihin liittyvällä aineistolla.
Akatemiasammon pääaineistona oleva alkuperäinen ylioppilasmatrikkeliaineisto on translitteroitu ja digitoitu käsityönä tietokannaksi laajassa hankkeessa ja siihen on lisätty samalla runsaasti tietoa ylioppilaiden myöhemmistä elämänvaiheista. Kyseessä on ollut n. 10 henkilötyövuoden urakka, jonka vetäjinä ovat olleet Yrjö Kotivuori Kansallisarkistosta ja Veli-Matti Autio Helsingin yliopiston arkistosta. Tietokannan aineisto on ollut haettavissa ja luettavissa Helsingin yliopiston keskusarkiston toimesta verkossa vuodesta 2005, mutta se ei ole ollut käytettävissä avoimena datana digitaalisten ihmistieteiden tutkimuksia varten eikä aineistojen tutkimiseen ole ollut tarjolla kehittyneitä haku-, selailu- ja data-analyysin työkaluja.
Aukeama Ylioppilasmatrikkelin henkilöhakemistosta Index
Akatemiasampo-hankkeen tavoitteet
Akatemiasampo-hankkeen tavoitteena on Helsingin yliopiston ylioppilasmatrikkelien 1640-1899 rikastaminen niihin liittyvien muiden henkilöhistoriallisten aineistojen avulla ja julkaiseminen älykkäänä Biografiasammon kaltaisena semanttisena portaalina ja linkitetyn avoimen datan palveluna. Palvelu on tarkoitettu tutkijoiden, yliopistolaisten ja laajemman yleisön käytettäväksi ja hyödynnettäväksi tutkimushankkeissa ja uusien sovellusten kehittämisessä. Akatemiasampo luo kuvaa omasta historiastaan ylpeästä, teknisesti edistyneestä suomalaisesta yliopistolaitoksesta digitaalisten ihmistieteiden keinoin. Palvelun innovaationa on tarjota lukijalle sisällöllisesti rikastettujen elämäkertojen ohella välineitä data-analyyttistä elämäkerrallista ja prosopografista tutkimusta varten. Järjestelmän kehittämiseen sisältyy myös omaa metodologista mielenkiintoa: siinä tutkitaan mm. tekstuaalisten matrikkelitietojen entiteettien (henkilöt, paikat jne.) ja käsitteiden tunnistamista ja tekstin rakenteistamista linkitetyksi dataksi, mikä mahdollistaa erilaisten data-analyyttisten työkalujen kehittämisen ja soveltamisen.
Oma tutkimusalueensa on eri lähteistä saatavien henkilöhistoriallisten aineistojen yhdistämisen tutkimus. Aineistot voivat olla sisällöltään toisiaan täydentäviä, päällekkäisiä, ristiriitaisia tai puutteellisia. Keskeistä lähdekriittisen tutkimuskäytön kannalta on tällöin eri lähteiden provenienssitiedon hallinta dataa yhdistettäessä (data fusion) ja datalukutaito (data literacy). Henkilöhistorialliset tiedot ovat kontekstualisoituja paikan ja ajan suhteen ja data-analyysien tulkinta puutteellisen, tilastollisesti painottuneen tai osin virheellisen tiedon avulla vaatii uudenlaista aineistojen luonteen ymmärtämistä tutkijalta. Esimerkiksi henkilön puoliso-, nimi ja ammatti voivat muuttua ajan mukaan. Oman ongelma-alueensa muodostaa henkilöiden kuvailuissa tarvittavat historialliset sanastot ja käsitteistöt, kuten ammatit ja organisaatiot, jotka vaativat omat ontologiset määrittelynsä. Esimerkiksi Biografia- ja Sotasampo-järjestelmien aineistoissa on käytössä tuhansia historiallisia ammatti- ja arvonimikkeitä, ja Akatemiasammon aineistoista niitä on löytynyt yli 10 000.
Tulokset: Akatemiasampo-portaali ja linkitetyn avoimen datan palvelu
Akatemiasampo-hankkeen tuloksena on kehitetty:
- Semanttinen portaali Akatemiasampo.fi, joka on uusi jäsen Sampo-portaalien sarjassa. Portaali on tarkoitettu kaikille henkilöhistoriasta ja prosopografiasta kiinnostuneille tutkijoille ja kansalaisille, eikä sen hakukoneiden ja data-analyyttisten työkalujen käyttö edellytä ohjelmointitaitoa.
- Linkitetyn avoimen datan palvelu CC-BY-4.0-linsenssillä Linked Data Finland -alustalla. Tämä Akatemiasampo-portaalin perustana oleva datapalvelu on tarkoitettu digitaalisten ihmistieteiden tutkijoille käyttämällä esimerkiksi YASGUI-työkalua ja SPARQL-kyselyitä tai Google Colab / Jupyter-dokumentteja. Akatemiasammon data on vapaasti käytettävissä sovellusten kehittäjille. Akatemiasampo-portaali on demonstraatio tästä mahdollisuudesta: se on toteutettu ainoastaan LDF.fi-palvelun tarjoaman SPARQL-rajapinnan varaan; käyttöliittymä ohjelmoitiin Sampo-UI-ohjelmointikehyksen avulla.
Molempia palveluita samoin kuin Akatemiasammon visiota ja taustoja on esitelty julkistustilaisuudessa 5.2.2021.
Akatemiasammon käyttö
Akatemiasampo-portaalin ja datapalvelun käyttöä on esitelty tarkemmin artikkelissa:
Akatemiasammon käyttö henkilöiden ja henkilöryhmien historiallisessa tutkimuksessa
Linkitetyn avoimen datan tietoinfrastruktuuri ja Sampo-portaalit
Akatemiasampo kuuluu digitaalisten ihmistieteiden linkitetyn avoimen datan infrastruktuuriin Suomessa (LODI4DH), joka on osa Suomen Akatemian tiekartalla olevaa digitaalisten ihmistieteiden tietoinfrastruktuuria FIN-CLARIAH.
Akatemiasampo luo osaltaan perustaa kansalliselle historiallisten henkilöiden ontologialle ja tunnisteille (URI), jota kautta henkilöihin eri lähteissä liittyvä tieto voidaan yhdistää. Aineistoa voidaan rikastaa mm. muistiorganisaatioiden kokoelmatietojen kautta mukaan lukien Yliopistomuseon aineistot, Kansallisbibliografia Fennica, Valtion taidemuseon kokoelmat, Kansalliskirjaston Finna.fi ja yleisten kirjastojen Kirjasampo.fi. Ontologiatyön tavoitteena on samantyyppinen, yhteentoimiva ratkaisu ja verkkopalvelu kuin yhdysvaltalaisen Getty-säätiön linkitetyn avoimen datan ULAN-tesaurus, jossa on jo mukana n. 1000 suomalaista. Näin muodostuu yhteys suomalaisista henkilöistä kansainväliseen kontekstiin. Hankkeemme uutuutena ULAN:iin nähden on kuitenkin datan yhdistäminen eri aineistoista, ja että ontologian hyödyntämistä tuetaan kehittämällä sille käyttäliittymäsovellus tutkijoiden ja laajemman yleisän tarpeisiin, eräänlainen 'henkilöhistorioitsijan työpöytä'. Samalla rikastetaan Biografiasammon aineistoja matrikkeli- ja kokoelmadatalla, mitä on erityisesti toivottu biografiatutkijoiden toimesta. Työssä voidaan hyödyntää Biografiasammossa jo tehtyjä teknisiä ratkaisuja.
Muita semanttisen webin "sampoja" verkossa
Semanttisen laskennan tutkimusryhmä (SeCo) on julkaissut verkossa useita digitaalisten ihmistieteiden "sampoja" tutkijoiden ja laajemman yleisön käytettäväksi. Sampos-arjan datapalveluita ja semanttisia portaaleja on esitelty tarkemmin sivulla Sampo Model and Series of Semantic Portals.
'Sampojen' teknisenä perustana on semanttisen webin teknologioihin ja linkityn datan ideaan perustuva 'Sampo-malli' (Hyvönen, 2022) ja Sampo-UI ohjelmointikehys (Ikkala et al., 2022) käyttöliittymien toteuttamista varten.
Videoita Akatemiasammosta
Alla olevat lyhyet videot antavat yleiskuvan Akatemiasampo-hankkeesta, Akatemiasammon avoimesta datapalvelusta, Akatemiasampo.fi-portaalista ja näiden käytöstä tutkimuksessa:
Akatemiasampo-hankkeen visio ja toteutus
Akatemiasampo-datapalvelun ja -portaalin käyttö tutkimuksessa
Akatemiasampo-datapalvelun luominen
Yhteistyökumppanit
Akatemiasampo on toteutettu Aalto-yliopistossa yhteistyössä Helsingin yliopiston digitaalisten ihmistieteiden keskuksen HELDIG ja Helsingin yliopiston arkiston ja kirjaamon Arkki kanssa.Yhteyshenkilöt ja projektiryhmä SeCossa
Prof. Eero Hyvönen (vetäjä),
Aalto-yliopisto, tietotekniikan laitos, ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities
DI Petri Leskinen,
Aalto-yliopisto, tietotekniikan laitos
FM Heikki Rantala,
Aalto-yliopisto, tietotekniikan laitos
DI Esko Ikkala,
Aalto-yliopisto, tietotekniikan laitos
TkT Jouni Tuominen,
Aalto-yliopisto, tietotekniikan laitos, ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities