Raja-Karjalan korpus Aineiston lisenssi on CC BY 4.0 (1.1.2018 alkaen) Lisätietoa aineistosta: http://urn.fi/urn:nbn:fi:lb-2017121322 Tämä kansio sisältää Raja-Karjalan korpuksen. Korpus käsittää haastatteluja kuudelta eri pitäjältä, jotka kaikki ovat omissa erillissä alikansioissaan. Jokainen näistä pitäjäkohtaisista alikansioista sisältää kolme erillistä kansiota; *_textgrid (pitäjäkohtaiset lausumatason TextGrid-tiedostot (UTF-8)), *_txt (pitäjäkohtaiset litteraatio–txt-tiedostot (UTF-8)) sekä *_wav (pitäjäkohtaiset äänitiedostot). TextGrid-tiedostojen tyyppi: UTF-8 Unicode Litteraatiotiedostojen tyyppi: UTF-8 Unicode Äänitiedostojen tyyppi: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 44100 Hz Tiedostojen nimeämiskäytäntö: Tiedostonimet ovat muotoa {Pitäjä}_{TUNNISTE}_{SKNA}_{NAUHA}.{wav|txt|TextGrid}, jossa {Pitäjä}: Keruupaikkakunnan nimi (ilman ääkkösiä), esim. Korpiselka {TUNNISTE}: Tiedoston tunniste, joka koostuu - pitäjäkohtaisesta informantin tunnuksesta (numero) - informantin sukupuolesta (m=mies, n=nainen) - informanttikohtaisesta näytteen tunnuksesta (iso kirjain), jos samalta informantilta on useita näytteitä Jos tiedostossa on useampi informantti, heidät on erotettu alaviivalla. Esim. "05mC": pitäjän informantin 05 (mies) näyte C "08nB_09nB": pitäjän informantin 08 (nainen) näyte B sekä pitäjän informantin 09 (nainen) näyte B {SKNA}: Suomen kielen nauhoitearkiston tunniste (signum), esim. "SKNA_7439" {NAUHA}: Kohta kelanauhalla, esim. "2b" {wav|txt|TextGrid}: Tiedoston tyyppi Kielivara sisältää henkilötietoja.