» back to normal layout
Akatemiasampo
Akateemiset henkilöt Suomessa 1640-1899

Projektin tausta

Helsingin yliopiston keskusarkiston alkuperäisaineistoista digitoidut Ylioppilasmatrikkelit 1640-1899 sisältävät yksityiskohtaista tietoa yli 28 000 historiallisesta suomalaisesta, kaikista tiedossa olevista tuona aikana Suomessa akateemisen koulutuksen saaneista henkilöistä, sillä muita yliopistoja ei Suomessa tuolloin ollut. Aineisto kattaa keskeisen osan Suomen ja suomalaisen yliopistolaitoksen historiaa. Suomalaisen Kirjallisuuden Seuran, Suomen Historiallisen Seuran ja muiden tieteellisten seurojen yhteistyönä on puolestaan luotu Kansallisbiografia ja muita biografiakokoelmia, yhteensä 13 144 pienoiselämäkertaa 977 elämäkerturin voimin. Aineisto on ollut saatavilla suurteossarjana ja biografiat on nyttemmin julkaistu myös verkkopalveluna ja semanttisena portaalina ja avoimena datapalveluna Biografiasampo. Akatemiasampo soveltaa ja kehittää edelleen Biografiasammossa ja muissa Sampo-portaaleissa luotua semanttisen laskennan teknologiaa digitaalisissa ihmistieteissä uudella, historiallisiin akateemisiin henkilöihin liittyvällä aineistolla.

Akatemiasammon pääaineistona oleva alkuperäinen ylioppilasmatrikkeliaineisto on translitteroitu ja digitoitu käsityönä tietokannaksi laajassa hankkeessa ja siihen on lisätty samalla runsaasti tietoa ylioppilaiden myöhemmistä elämänvaiheista. Kyseessä on ollut n. 10 henkilötyövuoden urakka, jonka vetäjinä ovat olleet Yrjö Kotivuori Kansallisarkistosta ja Veli-Matti Autio Helsingin yliopiston arkistosta. Tietokannan aineisto on ollut haettavissa ja luettavissa Helsingin yliopiston keskusarkiston toimesta verkossa vuodesta 2005, mutta se ei ole ollut käytettävissä avoimena datana digitaalisten ihmistieteiden tutkimuksia varten eikä aineistojen tutkimiseen ole ollut tarjolla kehittyneitä haku-, selailu- ja data-analyysin työkaluja.

Aukeama Ylioppilasmatrikkelin henkilöhakemistosta Index

Akatemiasampo-hankkeen tavoitteet

Akatemiasampo-hankkeen tavoitteena on Helsingin yliopiston ylioppilasmatrikkelien 1640-1899 rikastaminen niihin liittyvien muiden henkilöhistoriallisten aineistojen avulla ja julkaiseminen älykkäänä Biografiasammon kaltaisena semanttisena portaalina ja linkitetyn avoimen datan palveluna. Palvelu on tarkoitettu tutkijoiden, yliopistolaisten ja laajemman yleisön käytettäväksi ja hyödynnettäväksi tutkimushankkeissa ja uusien sovellusten kehittämisessä. Akatemiasampo luo kuvaa omasta historiastaan ylpeästä, teknisesti edistyneestä suomalaisesta yliopistolaitoksesta digitaalisten ihmistieteiden keinoin. Palvelun innovaationa on tarjota lukijalle sisällöllisesti rikastettujen elämäkertojen ohella välineitä data-analyyttistä elämäkerrallista ja prosopografista tutkimusta varten. Järjestelmän kehittämiseen sisältyy myös omaa metodologista mielenkiintoa: siinä tutkitaan mm. tekstuaalisten matrikkelitietojen entiteettien (henkilöt, paikat jne.) ja käsitteiden tunnistamista ja tekstin rakenteistamista linkitetyksi dataksi, mikä mahdollistaa erilaisten data-analyyttisten työkalujen kehittämisen ja soveltamisen.

Oma tutkimusalueensa on eri lähteistä saatavien henkilöhistoriallisten aineistojen yhdistämisen tutkimus. Aineistot voivat olla sisällöltään toisiaan täydentäviä, päällekkäisiä, ristiriitaisia tai puutteellisia. Keskeistä lähdekriittisen tutkimuskäytön kannalta on tällöin eri lähteiden provenienssitiedon hallinta dataa yhdistettäessä (data fusion) ja datalukutaito (data literacy). Henkilöhistorialliset tiedot ovat kontekstualisoituja paikan ja ajan suhteen ja data-analyysien tulkinta puutteellisen, tilastollisesti painottuneen tai osin virheellisen tiedon avulla vaatii uudenlaista aineistojen luonteen ymmärtämistä tutkijalta. Esimerkiksi henkilön puoliso-, nimi ja ammatti voivat muuttua ajan mukaan. Oman ongelma-alueensa muodostaa henkilöiden kuvailuissa tarvittavat historialliset sanastot ja käsitteistöt, kuten ammatit ja organisaatiot, jotka vaativat omat ontologiset määrittelynsä. Esimerkiksi Biografia- ja Sotasampo-järjestelmien aineistoissa on käytössä tuhansia historiallisia ammatti- ja arvonimikkeitä, ja Akatemiasammon aineistoista niitä on löytynyt yli 10 000.

Tulokset: Akatemiasampo-portaali ja linkitetyn avoimen datan palvelu

Akatemiasampo-hankkeen tuloksena on kehitetty:

  1. Semanttinen portaali Akatemiasampo.fi, joka on uusi jäsen Sampo-portaalien sarjassa. Portaali on tarkoitettu kaikille henkilöhistoriasta ja prosopografiasta kiinnostuneille tutkijoille ja kansalaisille, eikä sen hakukoneiden ja data-analyyttisten työkalujen käyttö edellytä ohjelmointitaitoa.
  2. Linkitetyn avoimen datan palvelu CC-BY-4.0-linsenssillä Linked Data Finland -alustalla. Tämä Akatemiasampo-portaalin perustana oleva datapalvelu on tarkoitettu digitaalisten ihmistieteiden tutkijoille käyttämällä esimerkiksi YASGUI-työkalua ja SPARQL-kyselyitä tai Google Colab / Jupyter-dokumentteja. Akatemiasammon data on vapaasti käytettävissä sovellusten kehittäjille. Akatemiasampo-portaali on demonstraatio tästä mahdollisuudesta: se on toteutettu ainoastaan LDF.fi-palvelun tarjoaman SPARQL-rajapinnan varaan; käyttöliittymä ohjelmoitiin Sampo-UI-ohjelmointikehyksen avulla.

Molempia palveluita samoin kuin Akatemiasammon visiota ja taustoja on esitelty julkistustilaisuudessa 5.2.2021.

Akatemiasammon käyttö

Akatemiasampo-portaalin ja datapalvelun käyttöä on esitelty tarkemmin artikkelissa:

Akatemiasammon käyttö henkilöiden ja henkilöryhmien historiallisessa tutkimuksessa

Linkitetyn avoimen datan tietoinfrastruktuuri ja Sampo-portaalit

Akatemiasampo kuuluu digitaalisten ihmistieteiden linkitetyn avoimen datan infrastruktuuriin Suomessa (LODI4DH), joka on osa Suomen Akatemian tiekartalla olevaa digitaalisten ihmistieteiden tietoinfrastruktuuria FIN-CLARIAH.

Akatemiasampo luo osaltaan perustaa kansalliselle historiallisten henkilöiden ontologialle ja tunnisteille (URI), jota kautta henkilöihin eri lähteissä liittyvä tieto voidaan yhdistää. Aineistoa voidaan rikastaa mm. muistiorganisaatioiden kokoelmatietojen kautta mukaan lukien Yliopistomuseon aineistot, Kansallisbibliografia Fennica, Valtion taidemuseon kokoelmat, Kansalliskirjaston Finna.fi ja yleisten kirjastojen Kirjasampo.fi. Ontologiatyön tavoitteena on samantyyppinen, yhteentoimiva ratkaisu ja verkkopalvelu kuin yhdysvaltalaisen Getty-säätiön linkitetyn avoimen datan ULAN-tesaurus, jossa on jo mukana n. 1000 suomalaista. Näin muodostuu yhteys suomalaisista henkilöistä kansainväliseen kontekstiin. Hankkeemme uutuutena ULAN:iin nähden on kuitenkin datan yhdistäminen eri aineistoista, ja että ontologian hyödyntämistä tuetaan kehittämällä sille käyttäliittymäsovellus tutkijoiden ja laajemman yleisän tarpeisiin, eräänlainen 'henkilöhistorioitsijan työpöytä'. Samalla rikastetaan Biografiasammon aineistoja matrikkeli- ja kokoelmadatalla, mitä on erityisesti toivottu biografiatutkijoiden toimesta. Työssä voidaan hyödyntää Biografiasammossa jo tehtyjä teknisiä ratkaisuja.

Muita semanttisen webin "sampoja" verkossa

Semanttisen laskennan tutkimusryhmä (SeCo) on julkaissut verkossa useita digitaalisten ihmistieteiden "sampoja" tutkijoiden ja laajemman yleisön käytettäväksi. Sampos-arjan datapalveluita ja semanttisia portaaleja on esitelty tarkemmin sivulla Sampo Model and Series of Semantic Portals.

'Sampojen' teknisenä perustana on semanttisen webin teknologioihin ja linkityn datan ideaan perustuva 'Sampo-malli' (Hyvönen, 2022) ja Sampo-UI ohjelmointikehys (Ikkala et al., 2022) käyttöliittymien toteuttamista varten.

Videoita Akatemiasammosta

Alla olevat lyhyet videot antavat yleiskuvan Akatemiasampo-hankkeesta, Akatemiasammon avoimesta datapalvelusta, Akatemiasampo.fi-portaalista ja näiden käytöstä tutkimuksessa:

Akatemiasampo-hankkeen visio ja toteutus

Akatemiasampo-datapalvelun ja -portaalin käyttö tutkimuksessa

Akatemiasampo-datapalvelun luominen

Yhteistyökumppanit

Akatemiasampo on toteutettu Aalto-yliopistossa yhteistyössä Helsingin yliopiston digitaalisten ihmistieteiden keskuksen HELDIG ja Helsingin yliopiston arkiston ja kirjaamon Arkki kanssa.

Yhteyshenkilöt ja projektiryhmä SeCossa

Prof. Eero Hyvönen (vetäjä),
Aalto-yliopisto, tietotekniikan laitos, ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities

DI Petri Leskinen,
Aalto-yliopisto, tietotekniikan laitos

FM Heikki Rantala,
Aalto-yliopisto, tietotekniikan laitos

DI Esko Ikkala,
Aalto-yliopisto, tietotekniikan laitos

TkT Jouni Tuominen,
Aalto-yliopisto, tietotekniikan laitos, ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities


Julkaisuja

2025

Eero Hyvönen, Annastiina Ahola, Petri Leskinen and Jouni Tuominen: Aggregating and Aligning Knowledge Graphs into a Global Service: SampoSampo System for Cross-cultural Data Search, Exploration, and Analysis. 2025. Abstract, submitted for peer review. bib pdf
Eero Hyvönen, Petri Leskinen, Henna Poikkimäki, Heikki Rantala, Jouni Tuominen, Senka Drobac, Ossi Koho, Ilona Pikkanen and Hanna-Leena Paloposki: Searching, exploring, and analyzing historical letters and the underlying networks: LetterSampo Finland (1809–1917) data service and semantic portal. 2025. Abstract, submitted for peer review. bib pdf

2024

Petri Leskinen: Modeling and Using Biographical Linked Data for Prosopographical Data Analysis. Dissertation, Aalto University, School of Science, Department of Computer Science, October, 2024. bib pdf
Eero Hyvönen: Creating and Using Biographical Dictionaries for Digital Humanities Based on Linked Data: A Survey of Web Services in Use in Finland. Proceedings of the Biographical Data in a Digital World 2022 (BD 2022), Tokyo, Institute of Cultural History, ZRC SAZU, Ljubljana, Slovenia, January, 2024. bib pdf link
Petri Leskinen and Eero Hyvönen: Biographical and Prosopographical Analyses of Finnish Academic People 1640–1899 Based on Linked Open Data. Proceedings of the Biographical Data in a Digital World 2022 (BD 2022), Tokyo, Institute of Cultural History, ZRC SAZU, Ljubljana, Slovenia, January, 2024. bib pdf link
Eero Hyvönen: How to Create a National Cross-domain Ontology and Linked Data Infrastructure and Use It on the Semantic Web. Semantic Web - Interoperability, Usability, Applicability, IOS Press, 2024. DOI: 10.3233/SW-243468. bib pdf link

2023

Petri Leskinen and Eero Hyvönen: Biographical and Prosopographical Analyses of Finnish Academic People 1640–1899 Based on Linked Open Data. Biographical Data in a Digital World 2022 (BD 2022), Tokyo, Proceedings, accepted, August, 2023. Forth-coming. bib pdf
Eero Hyvönen: Creating and Using a National Linked Open Data Infrastructure for Cultural Heritage Applications and Digital Humanities Research: Lessons Learned. DARIAH Annual Event 2023, Budapest, Hungary, abstracts of papers, DARIAH-EU, June, 2023. bib link
Eero Hyvönen: How to Create a National Cross-domain Ontology and Linked Data Infrastructure and Use It on the Semantic Web. Programming and Data Infrastructure in Digital Humanities, Book of Abstracts, pp. 7, High Performance Computing Centre, University of Évora, Portugal, March, 2023. bib link
Eero Hyvönen: Digital Humanities on the Semantic Web: Sampo Model and Portal Series. Semantic Web – Interoperability, Usability, Applicability, vol. 14, no. 4, pp. 729-744, IOS Press, 2023. bib pdf link

2022

Bernardo S. Buarque, Aline Deicke, Malte Doehne, Martin Düring, Heiner Fangerau, Catherine Herfeld, Charles van den Heuvel, Eero Hyvönen, Roberto Lalli, Malte Vogl, Lea Weiß, Dirk Wintergrün: White Paper of the ModelSEN Workshop (April 2022). October, 2022. bib link
Petri Leskinen, Heikki Rantala and Eero Hyvönen: Analyzing the Lives of Finnish Academic People 1640–1899 in Nordic and Baltic Countries: AcademySampo Data Service and Portal. DHNB 2022 The 6th Digital Humanities in Nordic and Baltic Countries Conference, CEUR Workshop Proceedings, long papers, Vol. 3232, March, 2022. bib pdf link
Esko Ikkala, Eero Hyvönen, Heikki Rantala and Mikko Koho: Sampo-UI: A Full Stack JavaScript Framework for Developing Semantic Portal User Interfaces. Semantic Web – Interoperability, Usability, Applicability, vol. 13, no. 1, pp. 69-84, January, 2022. Online version published in 2021, print version in 2022. bib pdf link

2021

Petri Leskinen and Eero Hyvönen: Reconciling and Using Historical Person Registers as Linked Open Data in the AcademySampo Knowledge Graph. Proceedings of the 20th International Semantic Web Conference (ISWC 2021), Springer, October, 2021. bib pdf link
Petri Leskinen and Eero Hyvönen: Using the AcademySampo Portal and Data Service for Biographical and Prosopographical Research in Digital Humanities. ISWC-Posters-Demos-Industry 2021 International Semantic Web Conference (ISWC) 2021: Posters, Demos, and Industry Tracks, CEUR Workshop Proceedings, Oct, 2021. bib pdf link
Eero Hyvönen, Petri Leskinen, Heikki Rantala, Esko Ikkala and Jouni Tuominen: Akatemiasampo-portaali ja -datapalvelu henkilöiden ja henkilöryhmien historialliseen tutkimukseen (AcademySampo Portal and Data Service for Biographical and Prosopographical Research). Informaatiotutkimus, vol. 40, no. 2, pp. 28-56, May, 2021. bib pdf link

2020

Eero Hyvönen: Semantic Sampo Portals for Digital Humanities Based on a National Linked Open Data Infrastructure. 2020. White paper, Aalto University, Semantic Computing Research Group (SeCo). bib pdf
Eero Hyvönen: Sampo Model and Semantic Portals for Digital Humanities on the Semantic Web. DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, pp. 373-378, CEUR Workshop Proceedings, vol. 2612, Riga, Latvia, October, 2020. bib pdf link
Petri Leskinen and Eero Hyvönen: Linked Open Data Service about Historical Finnish Academic People in 1640–1899. DHN 2020 Digital Humanities in the Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 5th Conference, pp. 284-292, CEUR Workshop Proceedings, vol. 2612, Riga, Latvia, October, 2020. bib pdf link
Eero Hyvönen: Tekoäly ja semanttinen web tarjoavat huikeat mahdollisuudet suurten aineistojen hallintaan. Kansallisarkiston strategia 2025, näkökulmia tulevaan (Jussi Nuorteva, Päivi Happonen (ed.)), pp. 20-21, Kansallisarkisto, Helsinki, May, 2020. bib link

2018

Eero Hyvönen: Semanttinen web. Linkitetyn avoimen datan käsikirja (Semantic Web. Handbook of Linked Open Data). pp. 271, Gaudeamus, Helsinki, Finland, March, 2018. bib link
/var/www/html/include/secoweb/utils.php; Fri, 06 Dec 2024 19:39:30 +0000