FNC1: Kansalliskirjaston sanoma- ja aikakauslehtikokoelman suomenkieliset n-grammit 1820-2000 FNC1 sisältää Kansalliskirjaston sanoma- ja aikakauslehtikokoelman (KLK) suomenkielisestä osuudesta lasketut sanetason uni-, bi- ja trigrammit frekvensseineen. Nämä ovat ladattavissa zip-pakattuina tiedostoina sekä koko aineistosta yhteensä että vuosikymmenittäin. Tiedostoissa n-grammit ovat frekvenssin mukaan laskevassa järjestyksessä. Huomaa, että osa tiedostoista on varsin suuria, erityisesti koko aineiston bi- ja trigrammit Lisenssi: CC BY Lisätietoa: http://urn.fi/urn:nbn:fi:lb-2014073038 Tuki: kielipankki@csc.fi