------------------------------------------------------ CLARIN RES End-User License +NC +PRIV +DEP +OTHER v2.1 ------------------------------------------------------ (suomenkielinen lisenssiteksti alempana - see below for the license text in Finnish) Resource: Donate Speech Corpus (http://urn.fi/urn:nbn:fi:lb-2022102121) Rightholder: Helsingin yliopisto (University of Helsinki) The Rightholder grants the End-User a personal free, non-exclusive and perpetual (for the duration of the copyright) right to use and make copies of the Resource for the purpose agreed with the End-User as such, as modified, or as part of a compilation or derived work. The permission applies to all known or future modes and means of communication and includes a right to make modifications enabling the use of the Resource on other devices and in other formats. Additional license terms as defined in the Terms of Service Agreement: *** Identification and Access Conditions ID: The End-User must be authenticated or identified. PLAN: The End-User must present a research plan before the license can be granted. The End-User may only use the Resource for the purpose described in the research plan. *** General conditions of use BY: The Author(s) of the Resource must be mentioned in connection with use. NC: The Resource may not be used for profit-making purposes. Research projects involving Business Finland, the Academy of Finland or other similar parties are not considered to involve profit-making purposes, even if some of the funding comes from companies. PRIV: There are personal data in the Resource. The End-User must comply with the data processing terms and conditions of this Resource. The End-User may process the personal data in the Resource only as long as there is a legal purpose for the processing, after which the personal data must be deleted. *** Distribution conditions NORED: The Resource may not be disclosed to third parties. However, the Resource may be disclosed to subcontractors with whom appropriate agreements have been made concerning the subcontracted service and the processing of personal data. Subcontractors are only allowed to use the Resource to perform the service. DEP: Modified versions of the Resource can be made available through the CLARIN service by separate agreement with CLARIN. *** Other terms of use OTHER: There are other non-standard conditions in the license that the End-User should pay attention to. Prior to accepting this agreement and starting to process the Resource, the End-User must ensure that it has the right to accept the license and the data protection terms and conditions (see below) according to the instructions provided by the End-User’s home organization. This license has been made in compliance with copyright agreements by WIPO - the World Intellectual Property Organization. The rights granted in this license shall be so interpreted that in case applicable intellectual property laws grant rights not mentioned in this license, they are also regarded as part of the rights to be licensed; the purpose of this license is not to restrict any rights intended to be licensed within different legal systems. Additional rights to the Resource may be agreed separately in writing. The Language Bank has the right to amend these terms on legitimate grounds, which may relate to, including but not limited to, instructions given by authorities, best practice, or changes in data protection laws or other applicable laws. A notification of any changes made shall be provided sixty (60) days before they take effect on the Language Bank’s website, as well as by email to the addresses included in the User’s application for access to the Resource. ------------------------------------------------------ DATA PROTECTION TERMS AND CONDITIONS FOR THIS RESOURCE ------------------------------------------------------ The specific conditions regarding the processing of the personal data in the Resource are described below. In addition to these conditions, see the guidelines for processing personal data in the Language Bank of Finland, http://urn.fi/urn:nbn:fi:lb-2020081521. *** Controller of the data stored in the Language Bank of Finland: University of Helsinki PO Box 3 00014 University of Helsinki Phone: 02941 911 For further details on the data protection of the resources in the Language Bank of Finland, please contact the helpdesk of the Language Bank. Data Protection Officer of the University of Helsinki: Email: tietosuoja@helsinki.fi ****** Description of the personal data ****** *** Types of personal data in the resource The original Resource consists of audio recordings of speech, technical metadata regarding the recording process, and answers that were voluntarily given by the speech donors to a set of non-mandatory background questions. Each piece of recorded audio may also be supplemented with a transcript of the speech content and other descriptions and mark-up that may be created manually or automatically. The recordings included in the Resource have not been edited with respect to their original content, although the technical format of the audio files may vary due to practical reasons. In some cases, the identity of the speaker may become evident either directly or indirectly, for instance due to their speaking voice or due to some of the content mentioned in the recording. However, the Resource may not be used for identifying speakers. The technical metadata includes the following types of information: - the operating system and browser version that were used by the speech donor - the technical resolution of the audio recording - the duration of the recording - the precise date and time of the recording - the numbers of the theme and topic, i.e., information regarding the stimuli provided to the speech donor, e.g., pictures, videos and instructions at which the speech recording was made. The technical metadata have been collected and included in the Resource on a coarse level. It is not possible to reveal the identity of the speech donor or the user of the device on the basis of the technical information. The background details provided by the speech donors include the following: - speaker’s own view of the dialect region that they represent (a closed list of coarsely defined alternatives, such as Uusimaa, Etelä-Savo, Satakunta etc.) - sex of the speaker - mother tongue(s) - age group (in decades) - place of residence (free text) - place of birth (free text), - occupation (free text) - level of education (selected from a closed list). It is not possible to verify the correctness of the background information mentioned above. The speech donors may have chosen to skip background questions or to submit false information. The free text answers could be provided at the desired level of detail. In case speech was donated several times via the same device, the donor may have given several different answers to the same background questions. *** Categories of data subjects The data subjects are volunteers who participated in the Donate Speech campaign (Lahjoita puhetta) by donating their speech and the background details of their choice. ****** Data protection terms and conditions ****** In these data protection terms and conditions, End-User means the party acting as the Controller for the Resource received, in accordance with the General Data Protection Regulation (EU) 2016/679. Depending on the case and the purpose of Resource use, End-User may therefore mean the Language Bank user’s employer or organisation (e.g., a university, university of applied sciences or other research organisation) or the service user personally. The End-User understands that when receiving the Resources, it becomes a controller, as referred to in the data protection legislation. The End-User must ensure that it complies with the applicable data protection legislation when processing personal data. *** The purpose of use of personal data The Resource may only be used for the research purpose described in the research plan approved by the Controller. *** Location and transfer of the personal data Personal data may not be processed outside the European Economic Area. In order to process the Resource outside the European Economic Area, a license may be granted only on the basis of a specific application. In that case, please contact the Language Bank of Finland. If the End-User processes personal data outside the European Economic Area, the Language Bank and the End-User shall put in place the safeguards required by Chapter V of the GDPR before the disclosure of the Resource to the End-User. The Language Bank has the right to refrain from transferring the Resource for processing outside the European Economic Area if it deems that such transfer in accordance with Chapter V of the GDPR is not possible by reasonable means. *** Other conditions for data processing The End-User shall not disclose or provide access to the Resource to any third party. Publication of the Resource is prohibited. Notwithstanding the aforementioned, the End-User may transfer the Resource to its subcontractors or service providers that act as processors of personal data for purposes consistent with this agreement. When employing processors, the End-User shall comply with the requirements of data protection legislation regarding processors of personal data, and conclude an agreement on the processing of personal data in accordance with Article 28 of the GDPR with the processors. The processing of the Resource in cloud-based services aimed at consumers is prohibited. The Resource shall not be used to identify speech donors. Recordings included in the Resource must not be combined with personal data available elsewhere, nor may recordings included in the Resource be compared to recordings available elsewhere to determine whether the speaker is the same person in both. The End-User shall notify the Language Bank without undue delay if the Resource is subjected to a personal data breach which results in the accidental or unlawful destruction, loss, alteration, unauthorised disclosure of, or access to, transferred, stored, or otherwise processed personal data. *** Obligation to notify The End-User shall notify the Language Bank without delay if it identifies or suspect the presence of the following content in the Resource: - Unauthorised, inaccurate, unnecessary or outdated personal data (such as direct identifiers, including names and contact details, information pertaining to the private life of individuals, rumours or defamatory speech), - Unauthorised copies of works or other objects protected by copyright or related rights, - Trade secrets, - Data whose disclosure would constitute an offence against privacy, public peace or personal reputation (Chapter 24 of the Criminal Code of Finland), incitement to hatred or ethnic agitation (Sections 10 and 10a, Chapter 11 of the Criminal Code of Finland) or another offence, or - Recordings where speech has been recorded without the speaker’s knowledge, or the recording has been started by accident. The notification made by the End-User shall include information that enables the Language Bank to identify the relevant recording. ****** Updates to the Resource ****** The Language Bank may produce new versions of the Resource to ensure, for example, that the rights of data subjects in accordance with Data Protection Legislation are fulfilled and that there is no unlawful content in the Resource. When the Language Bank produces a new version of the Resource and notifies the contact person of the End-User by email, the End-User shall, without delay, delete the old version of the Resource and replace it with the new version. The End-User must submit a functional and valid email address to the Language Bank to which notifications of updates to the Resource are to be sent. ****** Publish a link to your Privacy Notice ****** When you start using this Resource, share the title of your project that is understandable to the general public as well as the link to the publicly available privacy notice by using the form available at http://urn.fi/urn:nbn:fi:lb-2022052522. This information will be published on the website of the Language Bank of Finland. ------------------------------------------------------------------------------------- (lisenssi suomeksi) -------------------------------------------------------------------- CLARIN RES loppukäyttäjän lisenssisopimus +NC +PRIV +DEP +OTHER v2.1 -------------------------------------------------------------------- Aineisto: Lahjoita puhetta -aineisto (http://urn.fi/urn:nbn:fi:lb-2022102122) Oikeudenhaltija: Helsingin yliopisto (University of Helsinki) Oikeudenhaltija myöntää Käyttäjälle henkilökohtaisen maksuttoman, ei-yksinomaisen ja pysyvän (tekijänoikeuden voimassaoloajan kestävän) oikeuden käyttää ja kopioida Aineistoa Käyttäjän kanssa sovittuun tarkoitukseen muutettuna, muuttamattomana tai osana yhteenliitettyä teosta. Mainitut oikeudet koskevat kaikkia tunnettuja viestintävälineitä ja muotoja ja sisältävät oikeuden tehdä sellaisia muutoksia, jotka mahdollistavat Käyttäjälle Aineiston käyttämisen toisissa laitteissa ja formaateissa. ****** Palveluehtojen mukaiset lisenssiehdot: ****** *** Tunnistamiseen ja pääsyyn liittyvät ehdot ID: Käyttäjän on tunnistauduttava. PLAN: Käyttäjän on esitettävä tutkimussuunnitelma ennen lisenssin myöntämistä. Käyttäjä saa käyttää Aineistoa vain tutkimussuunnitelman mukaiseen tarkoitukseen. *** Käyttöön liittyvät ehdot BY: Aineiston tekijä(t) on mainittava käytön yhteydessä. NC: Aineistoa ei saa käyttää ansiotarkoituksessa. Business Finlandin, Suomen Akatemian tai muut vastaavat tutkimushankkeet eivät ole ansiokäyttöä, vaikka rahoituksessa olisi mukana myös yrityksiltä saatava rahoitusosuus. PRIV: Aineisto sisältää henkilötietoja, joiden käsittelyssä Käyttäjän on noudatettava aineistokohtaisia tietosuojaehtoja. Käyttäjä saa käsitellä Aineiston sisältämiä henkilötietoja vain niin kauan kuin sillä on käsittelyyn lainmukainen peruste, minkä jälkeen henkilötiedot on poistettava. *** Välittämiseen liittyvät ehdot NORED: Aineistoa ei saa luovuttaa kolmansille osapuolille. Aineistoa saa kuitenkin luovuttaa alihankkijoille, joiden kanssa on tehty asianmukaiset sopimukset alihankittavasta palvelusta sekä henkilötietojen käsittelystä. Alihankkijat saavat käyttää Aineistoa ainoastaan palvelun suorittamista varten. DEP: Aineiston muokattuja versioita voidaan saattaa saataviin CLARIN-palvelun kautta sopimalla asiasta erikseen CLARINin kanssa. *** Muut käyttöehdot OTHER: Aineistoon liittyy muita erikoisehtoja, joihin Käyttäjän on kiinnitettävä huomiota. Ennen tämän sopimuksen hyväksymistä ja Aineiston käsittelyn aloittamista Käyttäjän on varmistettava, että sillä on oman organisaationsa ohjeiden mukaan oikeus hyväksyä lisenssi ja tietosuojaehdot (alempana tässä dokumentissa). Käyttölupa on laadittu vastaamaan WIPOn tekijänoikeussopimuksia. Käyttöluvan myöntämiä oikeuksia tulee tulkita siten, että mikäli soveltuvassa tekijänoikeuslaissa myönnetään oikeuksia, joita tässä käyttöluvassa ei ole mainittu, myös ne katsotaan kuuluvaksi myönnettyihin oikeuksiin; tätä käyttölupaa ei ole tarkoitettu rajoittamaan eri oikeusjärjestyksissä myönnetyiksi tarkoitettuja oikeuksia. Aineiston käyttämisestä tätä laajemmin voidaan sopia erikseen kirjallisesti. Kielipankilla on oikeus tehdä näihin ehtoihin muutoksia perustelluista syistä, jotka voivat liittyä esimerkiksi viranomaisen antamiin ohjeisiin, hyviin käytäntöihin tai tietosuojalainsäädännön tai muun soveltuvan lainsäädännön muutoksiin. Muutoksista ilmoitetaan 60 päivää ennen niiden voimaantuloa Kielipankin verkkosivuilla sekä sähköpostitse niihin osoitteisiin, jotka on ilmoitettu Kielipankille Aineiston käyttöoikeuden hakemisen yhteydessä. ------------------------------- AINEISTON TIETOSUOJAEHDOT ------------------------------- Tämä Aineisto sisältää henkilötietoja, joiden käsittelyä koskevat erityisehdot on kuvattu alla. Tutustu lisäksi henkilötietoja sisältävien Kielipankin aineistojen käsittelyohjeisiin, http://urn.fi/urn:nbn:fi:lb-2020081521. *** Kielipankkiin talletetun aineiston rekisterinpitäjä Helsingin yliopisto PL 3 00014 Helsingin yliopisto Puhelin: 02941 911 Lisätietoja Kielipankin aineistojen tietosuojasta voit pyytää FIN-CLARINin asiakaspalvelusta. Helsingin yliopiston tietosuojavastaava Sähköpostiosoite: tietosuoja@helsinki.fi ****** Henkilötietojen kuvaus ****** *** Aineiston sisältämien henkilötietojen tyypit Alkuperäinen Aineisto koostuu puheäänitteistä, äänitteiden tallennukseen liittyvistä teknisistä oheistiedoista sekä puhettaan lahjoittaneiden henkilöiden vapaaehtoisesti antamista taustatiedoista. Kuhunkin äänitallenteeseen voi liittyä myös puheen sanallisen sisällön tekstimuotoinen kuvaus eli litteraatti sekä muita kuvauksia ja merkkauksia, joita on tuotettu käsin tai koneellisesti. Aineistoon kuuluvat äänitteet ovat alkuperäisen sisältönsä osalta muokkaamattomia, vaikka äänitiedostojen tallennusformaatti saattaa käytännön syistä vaihdella. Joissakin tapauksissa puhujan henkilöllisyys voi käydä ilmi joko suoraan tai epäsuorasti esimerkiksi hänen oman puheäänensä tai äänitteessä mainittujen asioiden perusteella. Aineistoa ei kuitenkaan saa käyttää puhujien henkilöllisyyden selvittämiseen. Äänitteiden oheistietoihin sisältyvät - puheen lahjoittajan käyttämä käyttöjärjestelmä ja selainversio, - äänitteen tekninen tarkkuus - äänitteen kesto - äänityksen tarkka ajankohta - teeman ja aiheen numerot, ts. tiedot lahjoittajalle annetuista virikkeistä, esimerkiksi kuvista, videoista ja ohjeteksteistä, joiden kohdalla kyseinen puhetallenne syntyi. Tekniset oheistiedot on tallennettu Aineistoon karkealla tasolla siten, että laitetietojen perusteella ei voi selvittää tallenteen tekijän tai laitteen käyttäjän henkilöllisyyttä. Puheen lahjoittajien vapaaehtoisesti antamiin taustatietoihin kuuluu seuraavia tietoja: - puhujan oma käsitys edustamastaan murrealueesta (suljettu joukko karkeasti määriteltyjä vaihtoehtoja kuten esim. Uusimaa, Etelä-Savo, Satakunta jne.) - puhujan sukupuoli - äidinkieli/-kielet - ikäryhmä (ryhmiteltynä 10 vuoden tarkkuudella) - asuinpaikka (vapaatekstinä) - syntymäpaikka (vapaatekstinä), - ammatti (vapaatekstinä) - koulutustaso (suljetusta listasta valittu vaihtoehto). Taustatietojen oikeellisuutta ei ole mahdollista jälkikäteen tarkistaa. Puheen lahjoittajat ovat voineet halutessaan jättää taustatietokysymyksiä väliin tai he ovat saattaneet antaa niihin vääriä tietoja. Vapaatekstinä kirjoitettavat vastaukset on voinut antaa haluamallaan tarkkuudella. Jos puhetta on lahjoitettu samalla laitteella useita kertoja, lahjoittaja on voinut antaa samoihin taustatietokysymyksiin useita erilaisia vastauksia. *** Rekisteröityjen ryhmät Rekisteröidyt ovat Lahjoita puhetta –kampanjaan osallistuneita henkilöitä, jotka ovat vapaaehtoisesti lahjoittaneet puhettaan ja valitsemiaan taustatietoja. ****** Aineistoon liittyvät erityiset tietosuojaehdot ****** Käyttäjällä tarkoitetaan näissä tietosuojaehdoissa sitä tahoa, joka toimii vastaanotettavan Aineiston rekisterinpitäjänä yleisen tietosuoja-asetuksen (EU) 2016/679 mukaan. Käyttäjä voi siis tapauksesta ja Aineiston käyttötarkoituksesta riippuen olla Kielipankin käyttäjän työnantaja tai organisaatio, jossa hän toimii (esimerkiksi yliopisto, ammattikorkeakoulu tai muu tutkimusorganisaatio) tai palvelun käyttäjä henkilökohtaisesti. Käyttäjä ymmärtää, että Aineistoa vastaanottaessaan siitä tulee soveltuvan tietosuojalainsäädännön mukaan rekisterinpitäjä. Käyttäjä on vastuussa siitä, että se noudattaa henkilötietojen käsittelyssä soveltuvaa tietosuojalainsäädäntöä. *** Henkilötietojen käyttötarkoitus Aineistoa saa käyttää ainoastaan Rekisterinpitäjän hyväksymässä tutkimussuunnitelmassa kuvattuun tutkimustarkoitukseen. *** Henkilötietojen sijainti Aineistoa ei saa käsitellä Euroopan talousalueen ulkopuolella. Aineiston voi saada käsiteltäväksi Euroopan talousalueen ulkopuolella vain erillisestä hakemuksesta. Ota siinä tapauksessa yhteyttä Kielipankkiin. Jos Käyttäjä tai Käyttäjän alihankkija tai palveluntarjoaja käsittelee henkilötietoja Euroopan talousalueen ulkopuolella, Kielipankki ja Käyttäjä toteuttavat yleisen tietosuoja-asetuksen V luvun edellyttämät suojatoimet ennen Aineiston siirtämistä Käyttäjälle. Kielipankilla on oikeus pidättäytyä Aineiston siirtämisestä käsiteltäväksi Euroopan talousalueen ulkopuolella, mikäli se katsoo, että Aineiston siirtäminen tietosuoja-asetuksen V lukua noudattaen ei ole kohtuudella mahdollista. *** Muut henkilötietojen käsittelyyn liittyvät ehdot Aineiston luovuttaminen tai siihen pääsyn antaminen kolmannelle osapuolelle sekä julkaiseminen on kielletty. Käyttäjä saa kuitenkin siirtää aineistoa henkilötietojen käsittelijöinä toimiville alihankkijoilleen tai palveluntarjoajilleen tämän sopimuksen mukaisiin tarkoituksiin. Käsittelijöitä käytettäessä on noudatettava EU:n yleisen tietosuoja-asetuksen vaatimuksia henkilötietojen käsittelijöistä, ja niiden kanssa on tehtävä asetuksen 28 artiklan mukainen sopimus henkilötietojen käsittelystä. Aineiston käsittely kuluttajille suunnatussa pilvipalvelussa on kielletty. Aineistoa ei saa käyttää puheen lahjoittajien henkilöllisyyden tunnistamiseen. Aineistoon sisältyviin äänitteisiin ei saa yhdistää muualta saatavilla olevia henkilötietoja, eikä Aineistoon sisältyviä äänitteitä saa verrata muualta saatavilla oleviin äänitteisiin sen selvittämiseksi, onko kyse samasta puhujasta. Käyttäjän on ilmoitettava Kielipankille ilman aiheetonta viivytystä, mikäli Aineistoon kohdistuu henkilötietojen tietoturvaloukkaus, jonka seurauksena on siirrettyjen, tallennettujen tai muuten käsiteltyjen henkilötietojen vahingossa tapahtuva tai lainvastainen tuhoaminen, häviäminen, muuttaminen, luvaton luovuttaminen taikka pääsy tietoihin. *** Ilmoitusvelvollisuus Käyttäjän on ilmoitettava viivytyksettä Kielipankille, jos se havaitsee tai epäilee, että Aineisto sisältää: - luvattomia, virheellisiä, tarpeettomia tai vanhentuneita henkilötietoja (esimerkiksi suoria tunnistetietoja kuten nimiä ja yhteystietoja, henkilön yksityiselämää koskevia tietoja, juoruja tai jotakuta herjaavaa puhetta), - luvattomia tekijänoikeuden tai sen lähioikeuksien suojaamien teosten tai muiden kohteiden kappaleita, - liikesalaisuuksia, - tietoja, joiden esittäminen ilmeisesti täyttäisi rikoslain yksityisyyden, rauhan ja kunnian loukkaamisen (24 luku), kiihottamisen kansanryhmää vastaan (11:10 – 10 a) tai muun rikoksen tunnusmerkistön, tai - äänitteitä, joissa puhetta on nauhoitettu puhujan tietämättä tai nauhoitus on käynnistetty vahingossa. Käyttäjän tulee liittää ilmoitukseen tiedot, joiden avulla Kielipankki voi tunnistaa kyseisen äänitteen. ****** Aineiston päivitykset ****** Kielipankki voi tuottaa Aineistosta uusia versioita esimerkiksi sen varmistamiseksi, että tietosuojalainsäädännön mukaiset rekisteröidyn oikeudet toteutetaan ja Aineisto ei sisällä lainvastaista sisältöä. Kun Kielipankki tuottaa Aineistosta uuden version ja ilmoittaa siitä sähköpostitse Käyttäjälle, Käyttäjän on viivytyksettä poistettava vanha versio Aineistosta ja korvattava se uudella. Käyttäjän on toimitettava Kielipankille toimiva ja ajantasainen sähköpostiosoitteensa, johon ilmoitetaan Aineiston päivityksistä. ****** Julkaise linkki omaan tietosuojailmoitukseen ****** Kun ryhdyt käyttämään tätä Aineistoa, ilmoita oman hankkeesi yleistajuinen otsikko sekä avoimesti saatavilla olevan tietosuojaselosteen linkki Kielipankille lomakkeella, joka on saatavilla osoitteessa http://urn.fi/urn:nbn:fi:lb-2022052521. Ilmoitetut tiedot julkaistaan Kielipankin verkkosivuilla. ---- This document was last updated / Viimeksi päivitetty: 21.10.2022 Persistent Identifier of the online version of this license / Tämän lisenssin verkkoversion pysyvä tunniste: http://urn.fi/urn:nbn:fi:lb-2022020223