» print this page!
» Follow us on Twitter
» Be our friend on Facebook

Latest News

Latest Publications

SeCo on Twitter

SeCo on Facebook

Biografiasampo:
Suomalaiset elämäkerrat semanttisessa webissä

In English using Google Translate

Kansalliset elämäkertakokoelmat verkossa

Suomen historian keskeisten henkilöiden elämäkertoja on toimitettu ja julkaistu verkossa erityisesti Suomalaisen Kirjallisuuden Seuran (SKS) Biografiakeskuksen toimesta Kansallisbiografiaksi ja erillisiksi tietokannoiksi mm. tunnetuista sotilashenkilöistä, kirkonmiehistä ja talousvaikuttajista. Vastaavia laajoja hankkeita on menossa muissakin maissa, esimerkikinä Britannian Oxford Dictionary of National Biography, USA:n American National Biography, Saksan Neue Deutsche Biographie, Ranskan Nouvelle Biographie Generale, Hollannin Biography Portal of the Netherlands ja BiographyNet ja Ruotsin Dictionary of Swedish National Biography: kansallisvaltioiden identiteettiä lujitetaan ja historiaa tarkastellaan usein omien suurmiesten ja -naisten toiminnan kautta. Perinteistä näkökulmaa suurmiehistä ja -naista on nykyisin laajennuttu mm. vähemmistöihin ja ns. "tavallisiin" henkilöihin tasapainoisemman kuvan luomiseksi. Elämäkerrallista tietoa julkaistaan verkossa runsaasti muuallakin, kuten Wikipediassa, organisaatioiden matrikkeleissa, kansainvälisissä auktoriteettitietokannoissa, sukututkimuksen piirissä, museoiden ja arkistojen kokoelmissa jne.

Visio ja tavoitteet

Biografiakeskuksen suomalaiset keskeiset elämäkerrat, yhteensä yli 13 000 kappaletta, ja vastaavat kansainväliset kokoelmat ovat kuitenkin olleet saatavilla vain tekstimuodossa ihmisen luettavaksi eikä semanttisena eli tietokoneen ”ymmärtämänä” datana. Hakuliittymien lisäksi muita palveluita elämäkertojen analysoimiseen ja tutkimiseen ei juuri ole tarjolla. Tämä olisi kuitenkin tarpeen älykkäitä tietokonesovelluksia ja data-analyyttistä tutkimusta varten digitaalisten ihmistieteiden alueella. Lisäksi suurin osa kotimaisista aineistoista on ollut maksumuurin takana, mikä on hankaloittanut aineistojen hyödyntämistä ja käyttöä. SKS:n elämäkerroilla on vuosittain n. 300 000 lukijaa ja niitä on kirjoittanut n. 1000 elämäkerturin joukko.

Biografiasampo merkitsee uuden aikakauden alkamista biografioiden verkkojulkaisemiselle. Järjestelmässä on luotu suomalaisten elämäkertojen ja niitä rikastavien aineistojen linkitetyn datan palvelu, jonka varaan on toteutettu useista sovellusnäkymistä koostuva älykäs verkkopalvelu kansalaisten ja digitaalisten ihmistieteiden tutkijoiden käytettäväksi. Järjestelmä on kehitetty Aalto-yliopiston tietotekniikan laitoksen ja Helsingin yliopiston Digitaalisten ihmistieteiden keskuksen HELDIG Semanttisen laskennan tutkimusryhmässä (SeCo) osana laajempaa semanttisten elämäkertojen tutkimusta. Biografiasampo on jatkoa ryhmän aiemmille "sampo-järjestelmille" Kulttuurisampo (2008), Kirjasampo (2011), Matkailusampo (2011), Sotasampo (2015), Nimisampo (2019), ja Löytösampo, joilla on ollut satoja tuhansia käyttäjiä verkossa.

Biografiasammon idea ja toiminta on esitelty lyhyesti alla olevassa videossa:

Biografiasammon aineistot

Biografiasampo on prototyyppi kansallisesta järjestelmästä ja tietoinfrastuktuurista suomalaisten elämäkertojen sisällölliseksi rikastamiseksi teksteistä ja julkaisemiseksi verkossa linkitettynä datana (Linked Open Data). Suomalaisista biografioista on luotu kieliteknologian, tiedonlouhinnan ja tekoälyn avulla eri tietolähteitä yhdistävä tietämysverkko (Googlen termein "knowledge graph"), jonka dataa on rikastettu kulttuurihistoriallisten museoiden, kirjastojen, arkistojen ja mediatalojen kokoelmien avulla.

  1. Kansallisbiografia (kaikki aikakaudet)
  2. Kenraalit ja amiraalit (1809-1917)
  3. Suomen papisto (1800-1920)
  4. Talouselämän vaikuttajat (1700-luvulta 2000-luvulle)
  5. Turun hiippakunnan paimenmuistio (1554–1721)
Ydinaineistojen henkilöille on automaattisesti luotu kotisivut, joihin on yhdistetty SKS:n elämäkerran lisäksi muita elämäkertoja toisista lähteistä, jotka näytetään lukijalle iframe-ikkunassa alkuperäisen julkaisijan palvelimella siinä muodossa kuin ne siellä ovat:
  1. Wikipedia/Wikidata
  2. Sotasampo
  3. Vanhat Norssit semanttisessa webissä
  4. Kirjasampo
  5. SLS:n (Svenska Litteratursällskapet i Finland) Biografiskt Lexikon för Finland
  6. Geni.com-palvelun henkilö- ja sukupuusivut

Tämän lisäksi ydinelämäkertoja on linkitetty paitsi toisiinsa myös ulkoisiin kotimaisiin ja kansainvälisiin tietolähteisiin, kuten

  1. eduskunnnan julkaisemaan kansanedustaja-rekisteriin (1917-),
  2. henkilöiden kotisivuihin,
  3. Helsingin yliopiston historialliseen ylioppilasmatrikkeleihin,
  4. Edita Publishing Oy:n julkaisemiin J. V. Snellmanin koottuihin teoksiin,
  5. Suomen kansallisbibliografiaan Fennica
  6. Suomen humanistiverkko Agricolan aineistoista louhittuun Suomen historian HISTO-ontologiaan,
  7. eri maiden kansalliskirjastojen VIAF-tietokantaan ja
  8. Getty-säätiön historiallisten henkilöiden rekisteriin ULAN.

Tarjoamalla samasta henkilöstä dataa eri tietolähteistä, voidaan paitsi rikastaa aineistoja myös verrata ja arvioida eri aineistojen tietojen eroja ja luotettavuutta. Wikidatan rajapintojen kautta tarjoutuu jatkossa teoriassa mahdollisuus tietojen julkaisemiseen ja korjaamiseen yhdellä kertaa kaikissa erikielisissä Wikipedioissa.

Digitaalisten ihmistieteiden tukeminen

Biografiasammon innovaationa on muuntaa ydinelämäkertojen tekstit linkitetyksi dataksi sekä aineistojen rikastaminen muiden kulttuurihistoriallisten tietolähteiden avulla. Tämä edistää merkittävästi elämäkerrallisten aineistojen hyödyntämistä tutkimuksessa. Samalla tulee mahdolliseksi dataan perustuva prosopografinen tutkimus, jossa kohteena ovat yksittäisten henkilöiden sijasta eri kriteereillä valitut ihmisryhmät, niihin liittyvät ajallisen ja paikalliset ilmiöt, sekä erilaiset verkostot henkilöiden välisistä sukulais-, ammatti- ym. -suhteista. Biografiasammon kiinnostava uutuus kansainvälisiin biografiajulkaisuihin nähden on, että sen linkitetyn datan palvelun päälle on kehitetty joukko data-analyyttisiä sovellusnäkymiä tietojen yhdistelyä, visualisointia ja erilaisia analyysejä varten. Järjestelmä on monipuolisuudessaan ainutlaatuinen maailmassa.

Käyttö: idea ja toiminnallisuus

Biografiasammon ideaa on esitelty tarkemmin artikkelissa

Eero Hyvönen, Petri Leskinen, Minna Tamper, Heikki Rantala, Esko Ikkala, Jouni Tuominen ja Kirsi Keravuori: Biografiasammon tekoäly yhdistää ja rikastaa suomalaiset elämäkerrat semanttisessa webissä. PDF

sekä alla olevissa muissa julkaisuissa.

Biografiasammon käyttöä on havainnollistettu myös erillisellä sivulla: Esimerkkejä Biografiasammon käytöstä.

Alunperin vain Kansallisbiografian n. 6500 elämäkertaan keskittynyt pilottitoteutus "Semanttinen kansallisbiografia" hyödyntää nyt monia muitakin aineistoja ja saa siksi uuden nimen "Biografiasampo" verkkopalvelun julkistuksen yhteydessä. Järjestelmän arkkitehtuurin perustana on Aalto-yliopistossa ja Helsingin yliopistossa lanseerattu "Sampo-malli".

Sukututkimus ja kansalaistiede

Sisältötyötä voidaan jatkossa talkooistaa (crowdsource) sukututkijoiden tietokantojen piiriin, jolloin datajulkaisuun voidaan yhdistää kuuluisuuksien ohella yhä enemmän ”tavallisten” kansalaisten elämänlankoja ja aineistoja. Aineisto on jo linkitetty mm. Geni.com:n sukututkijoiden luomaan maailmanlaajuiseen sukupuupalveluun ja eräisiin suomalaisiin historiallisiin matrikkeleihin, kuten Helsingin yliopiston matrikkelitietokantaan, "Vanhat Norssit semanttisessa webissä" -palveluun ja Sotasammossa julkaistuihin Kansallisarkiston sotasurmatietokantoihin ja niihin yhdistyviin muihin sotahistoriallisiin aineistoihin.

Julkistustilaisuus 27.9.2018

Biografiasampo

http://biografiasampo.fi

otettiin käyttöön 27.9.2018 klo 15:00 SKS:n juhlasalissa pidetyssä julkistustilaisuudessa.

Julkistustilaisuuden esitelmien kalvot (PDF)

Lehdistötiedote Suomeksi (In English).

Muita semanttisen webin "sampoja" verkossa

Semanttisen laskennan tutkimusryhmä (SeCo) on julkaissut verkossa useita "sampoja" digitaalisten ihmistieteiden tutkijoiden ja laajemman yleisön käytettäväksi:

Kehitteillä ja valmistumassa on myös Löytösampo (arkeologia ja kansalaistiede), Lakisampo (oikeusministeriön Semanttinen Finlex -lakiaineistoihin liittyen), Sotasurmasampo 1914-1922 (sisällissodan, 1. maailmansodan ja heimosotien aineistot) ja Akatemiasampo (biografiset ylioppilasmartrikkelit).

'Sampojen' metodologisena perustana on semanttisen webin teknologioihin ja linkityn datan ideaan perustuva 'Sampo-malli'.

Kiitokset

Järjestelmän kehittämiselle ratkaisevan tärkeää oli rahoitus ja yritysyhteistyö Business Finlandin (alunperin Tekesin) Severi-projektissa ja siihen integroituneessa, Viestintäalan tutkimussäätiön rahoittamassa Assi-hankkeessa.

Yhteystiedot

Prof., johtaja Eero Hyvönen, Aalto-yliopisto, Semanttisen laskennan tutkimusryhmä (SeCo) ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities

Toimituspäällikkö, FT, Kirsi Keravuori, Suomalaisen Kirjallisuuden Seura SKS

Muut Biografiasampo-tiimin jäsenet

DI Petri Leskinen, Aalto-yliopisto, Semanttisen laskennan tutkimusryhmä (SeCo)

DI Minna Tamper, Aalto-yliopisto, Semanttisen laskennan tutkimusryhmä (SeCo)

DI Esko Ikkala, Aalto-yliopisto ja Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities, Semanttisen laskennan tutkimusryhmä (SeCo)

Dr. Jouni Tuominen, Helsingin yliopisto, HELDIG - Helsinki Centre for Digital Humanities

Heikki Rantala, Aalto-yliopisto ja Helsingin yliopisto


Tutkimusryhmän julkaisuja semanttisista biografioista

Submitted papers

Mikko Koho, Esko Ikkala and Eero Hyvönen: Reassembling the Lives of Finnish Prisoners of the Second World War on the Semantic Web. Proceedings of the Third Conference on Biographical Data in the Digital Age (BD 2019), September, 2019. Accepted. bib
This paper presents first results of a new, ninth application perspective for the semantic portal WarSampo - Finnish WW2 on the Semantic Web, based on a database of ca. 4460 Finnish prisoners of war in the Soviet Union. Our key idea is to reassemble the life of each prisoner of war by using Linked Data, based on information about the person in different data sources. Using the enriched aggregated data, a biographical global home page for each prisoner of war can be created, that is more complete than information in individual data sources. The application perspective is targeted to researchers of military history, to study and analyze the data in order to form new research questions or hypotheses, as well as to public in the large looking for information e.g., about their relatives that were captured as prisoners of war. Employing the faceted search of the application perspective, prosopographical research on subgroups of prisoners is possible.

2019

Howard Hotson, Thomas Wallnig, Jouni Tuominen, Eetu Mäkelä, and Eero Hyvönen: People. Reassembling the Republic of Letters in the Digital Age (H. Hotson and T. Wallnig (eds.)), pp. 119-136, Göttingen University Press, 2019. bib link
Eero Hyvönen, Petri Leskinen, Minna Tamper, Heikki Rantala, Esko Ikkala, Jouni Tuominen and Kirsi Keravuori: Linked Data – A Paradigm Change for Publishing and Using Biography Collections on the Semantic Web. Proceedings of the Third Conference on Biographical Data in a Digital World (BD 2019), Varna, Bulgaria, September, 2019. bib pdf
Mikko Koho, Esko Ikkala and Eero Hyvönen: Reassembling the Lives of Finnish Prisoners of the Second World War on the Semantic Web. Proceedings of the Third Conference on Biographical Data in a Digital World (BD 2019), Varna, Bulgaria, September, 2019. bib pdf
This paper presents first results of a new, ninth application perspective for the semantic portal WarSampo - Finnish WW2 on the Semantic Web, based on a database of ca. 4450 Finnish prisoners of war in the Soviet Union. Our key idea is to reassemble the life of each prisoner of war by using Linked Data, based on information about the person in different data sources. Using the enriched aggregated data, a biographical global home page for each prisoner of war can be created, that is more complete than information in individual data sources. The application perspective is targeted to researchers of military history, to study and analyze the data in order to form new research questions or hypotheses, as well as to public in the large looking for information e.g., about their relatives that were captured as prisoners of war. Employing the faceted search of the application perspective, prosopographical research on subgroups of prisoners is possible.
Petri Leskinen and Eero Hyvönen: Extracting Genealogical Networks of Linked Data from Biographical Texts. Proceedings of the 16th Extended Semantic Web Conference (ESWC 2019), Posters & demonstrations, June, 2019. bib pdf
Lia Gasbarra, Mikko Koho, Ilkka Jokipii, Heikki Rantala and Eero Hyvönen: An Ontology of Finnish Historical Occupations. Proceedings of the 16th Extended Semantic Web Conference (ESWC 2019), Posters & demonstrations, Springer, Portoroz, Slovenia, June, 2019. bib pdf
Historical datasets often impose the need to study groups of people based on occupation or social status. This paper presents first results in creating an ontology of historical Finnish occupations, AMMO, that enables selection of groups of people based on their occupation, occupational groups, or socioeconomic class. AMMO is linked to the international historical occupation classification HISCO and to a modern Finnish occupational classification for interoperability. AMMO will be used as a component in two semantic portals for Finnish war history.
Mikko Koho, Lia Gasbarra, Jouni Tuominen, Heikki Rantala, Ilkka Jokipii and Eero Hyvönen: AMMO Ontology of Finnish Historical Occupations. Proceedings of the The First International Workshop on Open Data and Ontologies for Cultural Heritage (ODOCH 19), vol. 2375, pp. 91-96, CEUR Workshop Proceedings, Rome, Italy, June, 2019. Vol 2375. bib pdf link
This paper introduces AMMO Ontology of Finnish Historical Occupations. AMMO is based on thousands of occupation labels extracted from three Finnish military historical datasets of the early 20th century: the first consists of the ca. 40 000 war-related death records around the time of the Finnish Civil War (1914–1922); the second consists of the ca. 95 000 death records of Finnish soldiers in the Winter War and Continuation War (1939–1944); the third contains the ca. 4500 records of Finnish prisoners of war in the Soviet Union during the WW2. Our goal from a Digital Humanities perspective is to use AMMO to study military history and these datasets based on the occupation and social status of the soldiers. AMMO will also be used as a component for faceted search and semantic recommendation in two semantic portals for Finnish military history. AMMO is aligned with the international historical occupation classification HISCO and with a modern Finnish occupational classification for international and national interoperability. The ontology is published as Linked Open Data in an ontology service.
Eero Hyvönen, Petri Leskinen, Minna Tamper, Heikki Rantala, Esko Ikkala, Jouni Tuominen and Kirsi Keravuori: BiographySampo - Publishing and Enriching Biographies on the Semantic Web for Digital Humanities Research. The Semantic Web. ESWC 2019 (Pascal Hitzler, Miriam Fernández, Krzysztof Janowicz, Amrapali Zaveri, Alasdair J.G. Gray, Vanessa Lopez, Armin Haller and Karl Hammar (eds.)), pp. 574-589, Springer-Verlag, June, 2019. bib pdf link
Minna Tamper, Eero Hyvönen and Petri Leskinen: Visualizing and Analyzing Networks of Named Entities in Biographical Dictionaries for Digital Humanities Research. Proceedings of the 20th International Conference on Computational Linguistics and Intelligent Text Processing (CICling 2019), Springer-Verlag, April, 2019. Accepted. bib pdf
Matti La Mela, Minna Tamper and Kimmo Kettunen: Finding Nineteenth-century Berry Spots: Recognizing and Linking Place Names in a Historical Newspaper Berry-picking Corpus. The Fourth Digital Humanities in the Nordic Countries 2019 (DHN2019), CEUR Workshop Proceedings, Copenhagen, Denmark, March, 2019. bib pdf link
Eero Hyvönen, Petri Leskinen, Minna Tamper, Heikki Rantala, Esko Ikkala, Jouni Tuominen and Kirsi Keravuori: Demonstrating BiographySampo in Solving Digital Humanities Research Problems in Biography and Prosopography. The Fourth Digital Humanities in the Nordic Countries 2019 (DHN2019), Book of Abstracts, University of Copenhagen, Copenhagen, Denmark, March, 2019. bib pdf link
Eero Hyvönen and Heikki Rantala: Knowledge-based Relation Discovery in Cultural Heritage Knowledge Graphs. DHN 2019 Digital Humanities in Nordic Countries. Proceedings of the Digital Humanities in the Nordic Countries 4th Conference, pp. 230-239, CEUR Workshop Proceedings, Vol-2364, Copenhagen, Denmark, March, 2019. bib pdf link
Eero Hyvönen: Historiallinen paikkatieto semanttisessa webissä: Biografiasampo. Positio, no. 1, Maanmittauslaitos, February, 2019. bib pdf
Heikki Rantala: Yhteyshaku semanttisessa webissä. MSc Thesis (in Finnish), University of Helsinki, Department of Computer Science, January, 2019. bib pdf
Tavallisessa haussa etsitään yksilöitä, kuten henkilöitä tai paikkoja. Joissain tilanteissa esimerkiksi historian tutkija voi olla kiinnostunut myös etsimään yhteyksiä henkilöiden ja paikkojen välillä. Tässä työssä esitetään metodi tällaisen yhteyshaun toteuttamiseksi käyttäen semanttisen webin sisältämää avointa dataa. Työssä muodostettiin graafi, joka sisältää kuvauksia Suomen kulttuu- rihistorian henkilöiden ja paikkojen välisistä kiinnostaviksi arvioiduista yhteyksistä. Graafi luotiin SPARQL CONSTRUCT -kyselyillä. Yhteyksien hakemista varten luotiin web-sovellus, joka hyödyntää fasettihakua. Tarvittavien SPARQL CONSTRUCT -kyselyjen luominen ei osoittautunut erityisen hankalaksi, mutta niiden soveltaminen yleisemmin eri aineistoihin vaatii jonkin verran työtä. Yhteyksien fasettihaku osoittautui mielenkiintoiseksi. Fasettihaku mahdollistaa haun tarkentamisen askel kerrallaan. Lisäksi yhteyksien suhteellisia määriä on mahdollista vertailla erilaisten rajausten mukaan. Tämä tarjoaa aineistoon uusia näkökulmia.

2018

Petri Leskinen, Eero Hyvönen and Jouni Tuominen: Analyzing and Visualizing Prosopographical Linked Data Based on Biographies. Proceedings of the Second Conference on Biographical Data in a Digital World 2017 (BD2017), vol. 2119, pp. 39-44, CEUR Workshop Proceedings, Linz, Austria, 2018. bib pdf link
This paper shows how faceted search on biographical data can be utilized as a flexible basis for filtering target groups of people and, in particular, how generic data analysis and visualization tools can then be applied for solving prosopographical research questions based on the filtered data. This idea is demonstrated and evaluated in practice by presenting two application case studies: 1) linked data extracted from a printed registry of over 10 000 alumni (1867–1992) of the prominent Finnish high school Norssi, and 2) a knowledge graph extracted from 13 000 short biographies of significant Finnish people (from 3rd century to present times) in the National Biography of Finland. In both cases, the data is enriched by linking their entities with several other external datasets.
Jouni Tuominen, Eero Hyvönen and Petri Leskinen: Bio CRM: A Data Model for Representing Biographical Data for Prosopographical Research. Proceedings of the Second Conference on Biographical Data in a Digital World 2017 (BD2017), vol. 2119, pp. 59-66, CEUR Workshop Proceedings, Linz, Austria, 2018. bib pdf link
Biographies make a promising application case of Linked Data: they can be used, e.g., as a basis for Digital Humanities research in prosopography and as a key data and linking resource in semantic Cultural Heritage (CH) portals. In both use cases, a semantic data model for harmonizing and interlinking heterogeneous data from different sources is needed. This paper presents such a data model, Bio CRM, with the following key ideas: 1) The model is a domain specific extension of CIDOC CRM, making it applicable to not only biographical data but to other CH data, too. 2) The model makes a distinction between enduring unary roles of actors, their enduring binary relationships, and perduing events, where the participants can take different roles modeled as a role concept hierarchy. 3) The model can be used as a basis for semantic data validation and enrichment by reasoning. 4) The enriched data conforming to Bio CRM is targeted to be used by SPARQL queries in a flexible ways using a hierarchy of roles in which participants can be involved in events.
Goki Miyakita, Petri Leskinen and Eero Hyvönen: Using Linked Data for Prosopographical Research of Historical Persons: Case U.S. Congress Legislators. Digital Heritage. Progress in Cultural Heritage: Documentation, Preservation, and Protection. 7th International Conference, EuroMed 2018, Nicosia, Cyprus, Springer-Verlag, November, 2018. bib pdf
Minna Tamper, Petri Leskinen, Kasper Apajalahti and Eero Hyvönen: Using Biographical Texts as Linked Data for Prosopographical Research and Applications. Digital Heritage. Progress in Cultural Heritage: Documentation, Preservation, and Protection. 7th International Conference, EuroMed 2018, Nicosia, Cyprus, Springer-Verlag, November, 2018. bib pdf
Eero Hyvönen, Petri Leskinen, Minna Tamper, Heikki Rantala, Esko Ikkala, Jouni Tuominen and Kirsi Keravuori: Biografiasammon tekoäly yhdistää ja rikastaa suomalaiset elämäkerrat semanttisessa webissä. Aalto-yliopisto, Semanttisen laskennan tutkimusryhmä (SeCo), Nov, 2018. bib pdf
Biografiasampo-järjestelmä käynnistää uuden aikakauden elämäkertakokoelmien julkaisemisessa ja käyttämisessä verkossa. Järjestelmän ydinaineistona on Kansallisbiografia ja muut Suomalaisen Kirjallisuuden Seuran (SKS) ja tieteellisten seurojen toimittamat pienoiselämäkerrat, yhteensä 13 100 elämäntarinaa, joita on kirjoittanut 900 suomalaista tutkijaa. Biografiasammon innovaationa on luoda kieliteknologian, tekoälyn ja semanttisen webin teknologioiden avulla elämäkertojen teksteistä ja niihin eri lähteissä liittyvistä tiedoista tietämysverkko (knowledge graph) ja kansallinen tietoinfrastruktuuri, joka koostuu miljoonista tietojen välisistä yhteyksistä. Tietämysverkko on julkaistu linkitetyn datan palvelussa, jonka varaan on toteutettu seitsemästä sovellusnäkymästä koostuva älykäs, kaikille avoin ja maksuton verkkopalvelu biografiasampo.fi kansalaisten ja digitaalisten ihmistieteiden tutkijoiden käytettäväksi.
Petri Leskinen, Goki Miyakita, Mikko Koho and Eero Hyvönen: Combining Faceted Search with Data-analytic Visualizations on Top of a SPARQL Endpoint. Proceedings of VOILA 2018, Monterey, California. CEUR Workshop Proceedings, Vol. 2187, October, 2018. bib pdf
Goki Miyakita, Petri Leskinen and Eero Hyvönen: U.S. Congress Prosopograher - A Tool for Prosopographical Research of Legislators. Proceedings of the ISWC 2018 Posters & Demonstrations, Industry and Blue Sky Ideas Tracks, CEUR Workshop Proceedings, Monterey, Califonia, USA, October, 2018. Vol 2180. bib pdf link
Eero Hyvönen, Petri Leskinen, Minna Tamper, Jouni Tuominen and Kirsi Keravuori: Semantic National Biography of Finland. Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference (DHN 2018), pp. 372-385, CEUR Workshop Proceedings, Vol-2084, Helsinki, Finland, March, 2018. bib pdf link
This paper presents the vision of publishing and utilizing textual biographies as Linked (Open) Data on the Semantic Web. As a case study, we publish the live stories of the National Biography of Finland, created by the Finnish Literature Society, as semantic, i.e., machine “understandable” metadata in a SPARQL endpoint using the Linked Data Finland (LDF.fi) service. On top of the data service various Digital Humanities applications are built. The applications include searching and studying individual personal histories as well as historical research of groups of persons using methods of prosopography. The biographical data is enriched by extracting events from unstructured and semi-structured texts, and by linking entities internally and to external data sources. A faceted semantic search engine is provided for filtering groups of people from the data for prosopographical research. An extension of the event-based CIDOC CRM ontology is used as the underlying data model, where lives are seen as chains of interlinked events populated from the data of the biographies and additional data sources, such as museum collections, library databases, and archives.
Eero Hyvönen: Semanttinen web. Linkitetyn avoimen datan käsikirja (Semantic Web. Handbook of Linked Open Data). pp. 271, Gaudeamus, Helsinki, Finland, March, 2018. bib link

2017

Jouni Tuominen, Eero Hyvönen and Petri Leskinen: Bio CRM: A Data Model for Representing Biographical Data for Prosopographical Research. Biographical Data in a Digital World 2017 (BD2017), Linz, Austria, November, 2017. bib pdf link
Petri Leskinen, Eero Hyvönen and Jouni Tuominen: Analyzing and Visualizing Prosopographical Linked Data Based on Short Biographies. Biographical Data in a Digital World 2017 (BD2017), Linz, Austria, November, 2017. bib pdf link
Petri Leskinen, Jouni Tuominen, Erkki Heino and Eero Hyvönen: An Ontology and Data Infrastructure for Publishing and Using Biographical Linked Data. Proceedings of the Workshop on Humanities in the Semantic Web (WHiSe II), CEUR Workshop Proceedings, Vienna, Austria, October, 2017. bib pdf
This paper describes the ontology model and published datasets of a digitized biographical person register. The applied ontology model is designed to represent people via their enduring roles and perduring lifetime events. The model is designed to support 1) prosopographical Digital Humanities research, 2) linking to resources in semantic Cultural Heritage portals, and 3) semantic data validation and enrichment by using SPARQL queries. The linked data approach enables to enrich a person s biography by interlinking it with space and time related biographical events, persons relating by social contacts or family relations, historical events, and personal achievements.
Eero Hyvönen, Petri Leskinen, Erkki Heino, Jouni Tuominen and Laura Sirola: Reassembling and Enriching the Life Stories in Printed Biographical Registers: Norssi High School Alumni on the Semantic Web. Proceedings, Language, Technology and Knowledge (LDK 2017), pp. 113-119, Springer-Verlag, Galway, Ireland, June, 2017. bib pdf link
This paper presents the idea to enrich printed biographical person registers with linked data related to events that took place after the register was published. By transforming printed historical documents into structured data, semantic search to written texts can be provided for the reader. Even more importantly, life stories of historical persons can be extended based on data linking by extracting semantic structures from printed texts, and by combining this data with external datasets and data services. Such linking provides an enriched context for prosopographical research on people in the register, as well as an enhanced reading experience for anyone interested in reading the biographies. As a concrete case study, a register 1867–1992 of over 10 000 alumni of the prominent Finnish high school “Norssi” was transformed into RDF, was enriched by data linking, was published as a linked data service, and is provided to end users via a faceted search engine and browser for studying lives of historical persons and for prosopographical research.

2014

Eero Hyvönen, Miika Alonen, Esko Ikkala and Eetu Mäkelä: Life Stories as Event-based Linked Data: Case Semantic National Biography. Proceedings of ISWC 2014 Posters & Demonstrations Track, CEUR Workshop Proceedings, October, 2014. bib pdf link
This paper argues, by presenting a case study and a demonstration on the web, that biographies make a promising application case of Linked Data: the reading experience can be enhanced by enriching the biographies with additional life time events, by proving the user with a spatio-temporal context for reading, and by linking the text to additional contents in related datasets.
/var/www/html/include/secoweb/utils.php; Tue, 15 Oct 2019 06:41:00 +0000