New Ready-Made Data for Recearchers
 ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌  ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌  ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ 
 ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌  ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌  ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌   ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ ‌ 

Jos viesti ei näy oikein, avaa viesti selaimessa


Tilastokeskuksen logo

News from Research Services / September 2025  - English version

 

Uusia valmisaineistoja tutkijoille

Iloisia uutisia tutkijoille! Tilastokeskus on julkaissut tutkimuskäyttöön kolme uutta valmisaineistoa kesän 2025 aikana: FOLK_ENHEN Ennakkotiedot henkilötunnuksellisista, PIAAC II Aikuisten taitotutkimus II sekä MIGR_OLESK Oleskelulupatiedot.


Ennakkotietoja henkilöistä


FOLK_ENHEN Ennakkotiedot henkilötunnuksellisista -valmisaineisto sisältää ennakollisia tietoja henkilöistä, joilla on suomalainen henkilötunnus – myös väestön ulkopuolelta. Lisäksi moduuli sisältää rekisteritietoja mm. kotikunnasta ja demografiasta. Tiedot ovat kuukausittaisia ennakkotietoja ja siten alustavia ja korjaamattomia. Uusi aineisto tarjoaa tutkijoille tuoreita tietoja, jotka mahdollistavat mm. ajankohtaistutkimuksen ja -analyysin. Lopulliset, korjatut tiedot löytyvät vuosittaisista FOLK-moduuleista.


Taitotutkimuksen tuloksista aineistoja


PIAAC eli kansainvälinen aikuisten taitotutkimus on OECD:n järjestämä kansainvälinen tutkimusohjelma, joka keskittyy työikäisten (16–65-vuotiaiden) aikuisten perustaitoihin. Otospohjainen PIAAC II Aikuisten taitotutkimus II -valmisaineisto perustuu toisen Kansainvälisen aikuisten taitotutkimuksen (PIAAC Cycle II) Suomen osuuteen ja siihen yhdistettyihin rekisteritietoihin. Taitotutkimuksella on kartoitettu Suomessa asuvan työikäisen aikuisväestön tiedonkäsittelyn perustaitoja – lukutaitoa, numerotaitoa ja adaptiivista ongelmanratkaisutaitoa. Tiedonkeruussa on toteutettu taitoja mittaava tehtäväosio ja laaja taustahaastatteluosio. Rekisteritietoja (mm. koulutus-, työllisyys-, tulo- ja tulonsiirtotietoja) on yhdistetty kolmelta eri ajankohdalta, vuosilta 2023, 2020 ja 2017. Aineisto ei ole liitettävissä suoraan muihin valmisaineistoihin, eikä aineisto päivity. Se voidaan kuitenkin yhdistää muuhun aineistoon räätälöidysti Tutkijapalveluiden kautta, mikäli rekisteritietojen yhdistäminen on sallittua tutkimukseen osallistuneiden henkilöiden informoinnin puitteissa.


Maahanmuuttajien oleskelulupatietoja


Maahanmuuttoviraston oleskelulupia koskevien tietojen luvittaminen ja jakelu siirtyivät Maahanmuuttovirastolta Tilastokeskukseen. Oleskelulupahakemustietoihin perustuva MIGR_OLESK Oleskelulupatiedot -valmisaineisto sisältää tietoja mm. hakemusten käsittelyperusteista, voimassaoloajoista ja kansalaisuuspäätöksistä vuodesta 2011 alkaen. Aineiston kokoamisessa on kuultu Migrin asiantuntijoita ja aineistoa käyttäneitä VATT Datahuoneen tutkijoita. Käyttöluvan saaminen edellyttää vahvoja tutkimuksellisia perusteluita. Aineiston päivityssykli pyritään saamaan kuukausitasolle.


Valmisaineistojen kuvaukset löytyvät Taika-katalogista ja aineistoja voi nyt hakea käyttöönsä Tutkijapalveluiden  lupapalvelun  kautta.


Tulossa uusia aineistomoduuleita


Jo julkaistujen aineistojen lisäksi, lähitulevaisuudessa julkaistaan seuraaviin tietoaihioihin liittyviä uusia valmisaineistomoduuleita:


KOSKI – opetushallituksen tietovarantoon perustuva aineistokokonaisuus perus-, lukio- ja ammatillisesta koulutukseen osallistumisesta ja opintosuorituksista vuodesta 2018 alkaen 


VARDA – varhaiskasvatuksen tietovarantoon perustuva aineistokokonaisuus varhaiskasvatuksen toimijoista, henkilöstöstä ja siihen osallistuvista lapsista vuodesta 2019 alkaen.


 

Pseudonymisoinnin muutokset tutkijapalveluissa  

Tutkijapalveluissa on alkuvuonna aloitettu pseudotunnisteiden laajamittainen uudistaminen. Uudistus on ensi vaiheessa koskenut muita kuin henkilötunnisteita ja uusien tunnisteiden käyttöönotto oli 1.4.2025. Seuraavaksi Tilastokeskus uudistaa myös henkilötunnisteen, jolloin suojattu henkilönumero korvataan uudella tunnisteella. Tämä päivitys suoritetaan loppuvuoden ja talven kuluessa valmisaineistoihin keskitetysti tutkijapalveluiden toimesta. Räätälöidyissä ja ulkopuolisissa eineistoissa tunnisteet vaihdetaan käyttäjien toimesta vastaavalla tavalla kuin 1.4.2025 alkaen on vaihdettu muiden kuin henkilöiden pseudotunnisteet, tätä varten toimitetaan vanhan ja uuden henkilötunnisteen linkkitaulu FIONAn D:\keys\-kansioon.


Olemme saaneet paljon palautetta ja kyselyitä siitä, että onko takaraja 30.9.2025 ehdoton ja mitä hankkeiden aineistoille tapahtuu, mikäli aikamääreeseen ei ehditä. Olemme päättäneet luopua aiemmin ilmoitetusta uudelleensuojauksen aikamääreestä 30.9.2025 ja asetamme uudeksi aikamääreeksi 30.4.2026. Uusi aikamääre koskee kaikkia pseudotunnisteita, sekä henkilöiden että muiden havaintojen tunnisteet tulisi olla uudelleensuojattu räätälöityihin ja TK:n ulkopuolisiin aineistoihin tähän mennessä. Tämä toivon mukaan on käyttäjille myös läpinäkyvämpää ja selkeämpää. Ilmoitamme vielä erikseen henkilötunnisteiden linkkitaulujen toimittamisesta FIONAan.


Tunnisteiden vaihtaminen tarkoittaa käytännössä uusien tunnisteiden poimimista linkkitaulusta aineistoon, vanhojen pudottamista pois ja lopulta tutkijapalveluilta pyydettävää aineiston siirtämistä D-levylle. Tästä on myös ohje D:\keys\ -kansiossa. Vaikka uuteen aikamääreeseen on vielä yli puoli vuotta, suosittelemme toteuttamaan muutokset hyvissä ajoin viime hetken vaikeuksien minimoimiseksi.

 

Muistutus: Osallistu kyselyyn rekisteritutkimuksen prosesseista ja koulutuksista  


FIRE-hanke kartoittaa tutkijoiden kokemuksia lupa- ja eettisistä prosesseista ja koulutustarpeista kolmella kyselyllä. Kiitos kaikille, jotka ovat jo vastanneet kyselyihin. Mikäli et ole vielä ehtinyt vastata, toivomme, että vastaat nyt. Vastausaikaa on 15.9. saakka.


Kysely tutkijoille ja hankkeiden vastuututkijoille: Kutsumme sinut osallistumaan kyselyyn, jossa selvitetään tutkijoiden kokemuksia rekisteritutkimuksen lupa- ja eettisistä prosesseista. Tämän kyselyn tavoitteena on kehittää tutkijoiden tueksi selkeämpiä ohjeita ja yhtenäisempiä käytäntöjä: https://link.webropolsurveys.com/Participation/Public/220b60d9-5885-43d0-af50-95ad11d8303b?displayId=Fin3406268.
Kyselyyn vastaaminen kestää noin 15 minuuttia.


Kysely tutkijoille ja jatko-opiskelijoille: Mikäli olet kiinnostunut rekisteritutkimuksesta tai harjoitat sitä, pyydämme vastaamaan kyselyyn, jossa tiedustelemme näkemyksiäsi siitä, millaista opetusta juuri sinä kaipaisit: https://forms.gle/LYs2uZGHJoYDPfCq8


Kysely tohtori- ja perustutkinto-ohjelmien vastuuhenkilöille ja menetelmäopettajille: Mikäli olet mukana järjestämässä menetelmäopetusta tai vastaat jostakin tutkinto-ohjelmasta, jossa on tai voisi olla määrällisiä menetelmiä koskevaa opetusta, vastaathan kyselyyn: https://forms.gle/KkeBypsmYSHEfPB58

 

New Ready-Made Data for Recearchers


Good news for researchers! Statistics Finland has released three new ready-made datasets for research use during summer 2025: FOLK_ENHEN Preliminary Data with Personal Identity Codes, PIAAC II Survey of Adult Skills II, and MIGR_OLESK Residence Permit Data.


Preliminary Data on Individuals


The FOLK_ENHEN Preliminary Data with Personal Identity Codes dataset contains preliminary information on individuals with a Finnish personal identity code – including those outside the resident population. In addition, the module includes register-based data such as municipality of residence and demographic characteristics. The data are monthly preliminary figures, and therefore provisional and uncorrected. This new dataset provides researchers with up-to-date information, enabling timely research and analysis. The final, corrected data are available in the annual FOLK modules.


Results of the Skills Survey


PIAAC, the Programme for the International Assessment of Adult Competencies, is an international research programme coordinated by the OECD, focusing on the basic skills of the working-age population (16–65 years). The sample-based PIAAC II Survey of Adult Skills II dataset is based on Finland’s participation in the second round of the International Survey of Adult Skills (PIAAC Cycle II), combined with register-based data.


The survey assessed the core information-processing skills of the working-age population living in Finland – literacy, numeracy, and adaptive problem-solving. Data collection consisted of a skills assessment and an extensive background interview. Register-based information (including education, employment, income, and social transfers) has been linked from three different time points: 2023, 2020, and 2017.


The dataset cannot be directly merged with other ready-made datasets and will not be updated. However, it can be combined with other data in a tailored manner through Research Services, provided that the linking of register data is permitted within the scope of information given to the survey participants.


Residence Permit Data on Immigrants


The licensing and distribution of residence permit data from the Finnish Immigration Service (Migri) have been transferred to Statistics Finland. The MIGR_OLESK Residence Permit Data ready-made dataset, based on residence permit application records, contains information such as grounds for processing applications, validity periods, and citizenship decisions, starting from 2011. The compilation of the dataset has involved consultation with experts from Migri as well as researchers from the VATT Data Room who have previously used the data. Granted user lisence requires strong research justification. The update cycle of the dataset is intended to be monthly.


Descriptions of the ready-made datasets can be found in the Taika catalogue, and researchers may now apply for access through the Research Services’ permit service.


Upcoming New Ready-Made Dataset Modules


In addition to the datasets already published, new ready-made dataset modules will soon be released on the following data sources:


KOSKI – a dataset based on the Finnish National Agency for Education’s KOSKI data repository, covering participation in and completion of basic, upper secondary, and vocational education from 2018 onwards.


VARDA – a dataset based on the early childhood education and care (ECEC) data repository, covering ECEC providers, staff, and participating children from 2019 onwards.

 

Pseudonymisation Changes in Research Services 

In Research Services, a large-scale renewal of pseudonyms was initiated earlier this year. In the first phase, the renewal concerned identifiers other than personal identifiers, and the new identifiers were introduced on April 1, 2025. Next, Statistics Finland will also renew the personal identifier, replacing the old shnro with a new identifier. This update will be carried out centrally by Research Services in the ready-made datasets during the end of the year and the winter. In customized and external datasets, users will replace the identifiers in the same way as pseudonyms other than personal ones have been replaced since April 1, 2025. For this purpose, a link table between old and new personal identifiers will be delivered to FIONA’s D:\keys\ folder.


We have received a lot of feedback and questions about whether the deadline of September 30, 2025, is absolute and what will happen to project datasets if the timeline cannot be met. We have decided to cancel the previously announced re-pseudonymisation deadline of September 30, 2025, and set a new deadline of April 30, 2026. The new deadline applies to all pseudonyms: both personal and other identifiers must be re-pseudonymised in customized and external datasets by then. Hopefully, this will also be more transparent and clearer for users. We will separately announce the delivery of the link tables for personal identifiers to FIONA.

FOLK_ENHEN – kuukausittaiset korjaamattomat ennakkotiedot väestöstä ja väestön ulkopuolisista henkilöistä vuodesta 2022 alkaen 


Changing identifiers in practice means extracting the new identifiers from the link table into the dataset, dropping the old ones, and finally requesting the transfer of the dataset to the D-drive from the Research Services. Instructions for this can also be found in the D:\keys\ folder. Although there is still more than half a year until the new deadline, we recommend implementing the changes well in advance to minimize last-minute difficulties.

 

 

Reminder: Help improve processes in register-based research

The FIRE project is collecting researchers’ experiences with permit and ethical review processes and educational needs. Thank you to everyone who has already responded to the surveys. If you haven’t responded yet, we kindly ask you to do so by September 15.


We invite you to participate in a survey exploring researchers’ experiences with ethical and permit processes in register-based research. The aim is to improve guidance and develop more consistent practices to better support researchers: https://link.webropolsurveys.com/Participation/Public/d9e77c4e-4115-4907-a2e7-179a3104ef37?displayId=Fin3403183 

The survey takes approximately 15 minutes to complete.


If you are interested in register-based research or actively conduct such research, we kindly ask you to complete the survey, where we inquire about the types of training you would find useful: https://forms.gle/LYs2uZGHJoYDPfCq8


Additionally, if you are involved in organizing education in quantitative methods and/or register-based research, please answer the following survey (in Finnish): https://forms.gle/KkeBypsmYSHEfPB58 




Tilastokeskuksen logo

Tilastokeskus

Työpajankatu 13, 00580 Helsinki

Tietopalvelu: info@stat.fi, p. 029 551 2220


Tietosuojaseloste

Muuta tilaustasi tai päätä tilaus