Skip to main content

Avoin tiede ja TKI: Aineistonhallinta

Tukipalvelut LABissa

LUT-tiedekirjasto tarjoaa tukea aineistohallinnan suunnitelman laadintaan ja datan hallintaan sekä kuvailuun sen määritetyn elinkaaren ajan. Tukipalvelut tavoitat parhaiten sähköpostitse openscience@lut.fi

Aineistonhallintaa tukevat palvelut

Aineistonhallinta pähkinänkuoressa

 1. Arvosta dataasi ja näytä se muille.
 2. Jaa datasi verkossa pysyvän tunnisteen kera.
 3. Huomioi datan jatkokäyttö jo tutkimuksen suunnitteluvaiheessa.
 4. Julkaise menetelmäsi.
 5. Viittaa dataasi julkaisuissasi.
 6. Julkaise koodisi (myös ne pätkät).
 7. Kerro, miten viitata ja käyttää dataasi.
 8. Hyödynnä datanhallinnan palveluja.
 9. Palkitse muita datan avaamisesta.
 10. Edistä datalähtöistä tutkimusta.

Lähde: Westman, Stina: Kymmenen tutkimusdatanhallinnan käskyä (22.1.2015)

Tutkimusaineiston hallinta LABissa

Lähde: CC BY Tietoarkisto, Aineistonhallinnan käsikirja

 

Tutkimusaineistojen avaaminen ja avoimet tutkimusmenetelmät ovat yksi avoimen TKI -toiminnan näkyvimpiä muotoja avoimen julkaisemisen lisäksi. Yhä useammat rahoittajat – muiden muassa Suomen Akatemia – edellyttävät, että rahoitushakemukseen sisältyy aineistonhallintasuunnitelma jossa kerrotaan, miten hanke hankkii ja käyttää tietoaineistoja, mitkä ovat aineistojen omistus- ja käyttöoikeudet, miten tietoaineistoja tullaan säilyttämään sekä miten tietoaineistoja avataan muille tutkijoille hankkeen aikana ja sen päätyttyä. TKI-hankkeiden aineistojen hallinnointi varmistaa, että ammattikorkeakouluissa tehtävä tutkimus on mahdollisimman korkeatasoista, vaikuttavaa, läpinäkyvää sekä toistettavissa olevaa.

Aineistojen hallinnointi on välttämätöntä kaikilla TKI-prosessin tasoilla ja se tulee varmistaa prosessin alusta lähtien. Hankkeille tuleekin jo suunnitteluvaiheessa tehdä aineistonhallintasuunnitelma. Suomen tutkimusorganisaatioille on kehitetty tätä varten oma työkalu, DMP Tuuli.

LABin hankkeissa tutkimusdatan ensisijaisena tallennuspaikkana suositellaan käytettäväksi IDA-palvelua. IDA on OKM:n tarjoama turvallinen tutkimusaineiston säilytyspalvelu korkeakouluille sekä Suomen Akatemian rahoituksella toimiville tutkijoille. IDA mahdollistaa myös yhteistyöhankkeet eri organisaatioiden välillä. Pysyvien tunnisteiden avulla IDA-palveluun tallennettuun tutkimusdataan voidaan linkittää tutkimuksen tuottamista julkaisuista sekä jakelukanavien viitteiden linkityksistä. IDA tarjoaa mahdollisuuden myös tutkimusaineistojen pitkäaikaissaatavuuteen (PAS).

Huomaathan kuitenkin, että henkilösensitiivinen data on tallennettava tutkimussuunnitelmassa määriteltävään turvalliseen palveluun. Mikäli tutkimusdata sisältää henkilösensitiivistä dataa, sitä ei lähtökohtaisesti saateta avoimeen käyttöön.

Hyödynnettäessä avoimesti jaettavaa tutkimusdataa on aineiston lähde ja tekijät merkittävä julkaisuun hyvän tavan mukaisesti.

Aineiston avaaminen lisää tutkimuksen läpinäkyyvyyttä ja vaikuttavuutta. Aineiston avaamisessa jatkokäyttöön suositellaan esim. Creative Commons –lisenssiä, jolloin tutkija voi määrittää datan jatkokäytön avoimuutta: http://creativecommons.fi/

Mikä on tutkimusaineistoa?

Datanhallinnan opas (ATT-hanke) määrittelee tutkimusaineiston seuraavasti:

Tutkimusaineistoilla tarkoitetaan niitä resursseja, joita tutkija tuottaa tai joita hän käyttää tutkimusprosessin aikana. Tutkimusaineistot voivat olla aineellisia tai aineettomia. Jotta aineisto olisi tutkimukseen kelpaavaa, siihen täytyy liittyä tietoja ainakin sen alkuperästä.Esimerkiksi datan liitteeksi tarvitaan kuvailevaa ja teknistä tietoa siitä mitä informaatiota se sisältää. Siksi tutkimusdataan liittyy paljon tietoa siitä, miten se on rakenteistettu ja koodattu, miten se on syntynyt ja miten sitä on käsitelty. Nämä tiedot on aina syytä tallentaa esimerkiksi metatietoihin, koodikirjoihin ja/tai muuhun dokumentaatioon.
Yhdessä datan kanssa tästä kokonaisuudesta muodostuu tutkimusaineisto.
 
Tyypillisiä aineistoja ovat
- kysely- ja haastatteluaineistot
- erilaiset mittaus- ja havainnointiaineistot
- muut video-, kuva-, ääni- ja tekstiaineistot
 
Pitkäaikaissäilytyksessä on huomioitava soveltuvat tiedostomuodot siirrettävyyden ja säilytettävyyden varmistamiseksi. Säilytyskelpoisia tiedostomuotoja on sellaiset formaatit, joissa tietosisällön säilyminen ja ymmärrettävyys voidaan taata pidemmällä aikavälillä. Tällaisia tiedostomuotoja ovat mm. Comma Separated Values (CSV), Extensible Markup Language (XML), Open Document Format (ODF) ja Plain Text (muotoilematon tekstitiedosto). Siirettäviä tiedostomuotoja ovat sellaiset, joita käytetään yleisesti KDK PAS-ratkaisuja hyödyntävissä organisaatioissa ja joissa säilytettävää aineistoa on runsaasti, esimerkiksi Microsoft Officen tiedostomuodot ja Portable Document Format (PDF). Lisätietoa KDK:n ohjeista: http://www.kdk.fi/images/tiedostot/KDK-PAS-tiedostomuodot-v1.4.pdf
 
Tutkimusaineiston kuvailuun on tärkeää kiinnittää huomiota. Kuvailemalla sisältö, muuttujat ja metodologiat varmistetaan aineiston käyttökelpoisuus. Metadata on kuvailevaa tietoa datasta, josta ilmenee olennaiset datan ominaisuuksien tiedot. Kuvailutiedoissa voidaan myös kertoa aineiston käyttöoikeuksiin liittyvistä tekijöistä. Hyvin kuvailtu aineisto on myös paremmin löydettävissä ja vaikuttaa tutkimuksen näkyvyyteen. Lisätietoa Tietoarkiston aineistonhallinnan oppaasta: http://www.fsd.uta.fi/aineistonhallinta/fi/aineiston-kuvailu-ja-metadata.html

TKI -aineistonhallinnan lähtökohdat

 • Pääsääntöisesti kaikki tulokset sekä aineistot ovat avoimia
 • Aineistolla tarkoitetaan hankkeessa tuotettuja, muokattuja sekä käytettyjä aineistoja, joihin hankeen tulokset perustuvat.
 • Noudatetaan hyvää aineistonhallintatapaa ts. tutkimuseettisiä periaatteita sekä lainsäädäntöä (sopimukset)
 • Luottamuksellisen/arkaluontoisen tietojen suojaamisesta, tietoturvasta sekä tietosuojasta on huolehdittava
 • Tarvitaan aineistoinfrastruktuuri, joka pitää sisällään aineiston hallintaa, käyttöä, löydettävyyttä ja jakamista tukevat työkalut ja palvelut
 • Tarvitaan tukea koko hankkeen elinkaaren aikana
 • Tulosten sekä aineistojen avaaminen tuottaa kustannuksia, jotka täytyy huomioida
 • Jokainen on vastuussa ohjeistusten noudattamisesta

TKI -aineistonhallinnan hyödyt

Data on altis monenlaisille vaaroille aina inhimillisistä erehdyksistä luonnonkatastrofeihin.

Hyvällä aineistonhallinnalla varmistetaan tutkimusaineiston säilyvyys, löytyvyys, saavutettavuus, ymmärrettävyys ja uudelleenkäytettävyys. Tästä on hyötyä sekä tutkijalle, organisaatiolle, tieteelle, rahoittajalle että koko yhteiskunnalle.

 • Tutkija löytää omat aineistonsa
 • Datan avaaminen tuo tutkijalle enemmän näkyvyyttä, lisää viitauksia ja on osa täten osa meritoitumista
 • Organisaatioissa tiedetään, millaisia aineistoja hankkeissa on kerätty ja miten ne saa käyttöön
 • TKI:n vaikuttavuus ja näkyvyys parantuvat
 • Mahdollistaa toistettavuuden -> luotettavuus, läpinäkyvyys
 • Nopeuttaa tutkimusta ja vähentää päällekkäistä työtä
 • Mahdollistaa esim. pitkittäistutkimukset
 • Rahoittajan on helpompi seurata resurssien käyttöä ja kohdentaa niitä
 • Lisää kaupallisia innovaatioita

DMPTuuli

Tuuli on suomalaisten tutkimusorganisaatioiden käyttöön kehitetty yhteinen aineistonhallintatyökalu, joka helpottaa aineistonhallintasuunitelman tekemistä ja toteuttamista. Tuuli on otettu käyttöön myös LABissa. Kirjaudu sisään ja tutustu!

Creative Commons

Creative Commons logo

Aineiston avaaminen lisää tutkimuksen läpinäkyvyyttä ja vaikuttavuutta. Aineiston avaamisessa jatkokäyttöön suositellaan LABissa esim. Creative Commons –lisenssiä, jolloin tutkija voi määrittää datan jatkokäytön avoimuutta. Tutustu lisenssiin ja sen tarjoamiin vaihtoehtoihin: http://creativecommons.fi/

Ohjeita ja oppaita

Tutkimusdataan viittaaminen

Tutkimusdataan viitataan kuten muihinkin lähteisiin, artikkeliin tai kirjallisuuteen. Tavoitteena on, että aineiston alkuperäinen tuottaja  tulee huomioitua. Viittausohjeita löytyy niin data-arkistojen verkkosivuilta kuin kustantajien kirjoitusohjeista.

Avoimen tieteen käsikirjan viittausohjeet
Tietoarkisto: aineistoon viittaaminen