SNC1 Kansalliskirjaston sanoma- ja aikakauslehtikokoelman ruotsinkieliset n-grammit 1770-1940 SNC1 sisältää Kansalliskirjaston sanoma- ja aikakauslehtikokoelman (KLK) ruotsinkielisestä osuudesta lasketut sanetason uni-, bi- ja trigrammit frekvensseineen. Nämä ovat ladattavissa zip-pakattuina tiedostoina sekä koko aineistosta yhteensä että vuosikymmenittäin. Tiedostoissa n-grammit ovat frekvenssin mukaan laskevassa järjestyksessä. Huomaa, että osa tiedostoista on varsin suuria, erityisesti koko aineiston bi- ja trigrammit. Lisenssi: CC BY Lisätietoa: http://urn.fi/urn:nbn:fi:lb-2014091902 Tuki: kielipankki@csc.fi