• Repozitorijs
  • Meklēšana korpusā
  • Par vietni
  • CLARIN
  •  Pieteikšanās
  • English Latviešu
  • CLARIN-LV repozitorija sākumlapa
  • Skatīt vienumu
  •  
  • CLARIN-LV logo
  •   Pārlūkot  
    •    Visi repozitoriji  
      •   Izdošanas datums
      •   Autori
      •   Nosaukumi
      •   Tēmas
      •   Izdevējs
      •   Valoda
      •   Tips
      •   Tiesību etiķete
  •   Mans konts  
    •    Pieteikšanās
  •   Statistika  
    •    Statistika BETA
  •   Vispārīga informācija  
    •    Deponēt
    •    Citēt
    •    Iesniegšanas dzīves cikls
    •    Bieži uzdotie jautājumi
    •    Par
    •    Palīdzības dienests
 
 

Balanced Corpus of Modern Latvian (LVK2018)

 
CLARIN Centre of Latvian language resources and tools
  Autori
Levāne-Petrova, Kristīne and Darģis, Roberts
  Vienuma identifikators
http://hdl.handle.net/20.500.12574/11
 Projekta URL
http://www.korpuss.lv/id/LVK2018
 Demonstrācijas URL
http://nosketch.korpuss.lv/#dashboard?corpname=LVK2018
 Norāde
https://doi.org/10.22364/vnf.10.12
 Izdošanas datums
2018
 Tips
corpus, text
 Lielums
12289240 tokens, 9813014 words, 20864 documents
 Valoda(-s)
Latvian
 Apraksts
LVK2018 is a balanced and representative 10 million word text corpus of modern Latvian. It represents five different genres: journalism (60%), fiction (20%), scientific (10%), legal (8%), transcriptions (2%). LVK2018 is an extended version of LVK2013.
 Izdevējs
AiLab IMCS UL
 Atbalsts

European Regional Development Fund

Projekta kods: 1.1.1.1/16/A/219

Projekta nosaukums: Full Stack of Language Resources for Natural Language Understanding and Generation in Latvian

 Tēma(-s)
text corpus general representative morphology reference corpus
 Kolekcija (s)
Language resources and tools of AiLab IMCS UL
Rādīt pilnu ierakstu
 
 

Partneri, koordinācija, finansējums

  • Latvijas Universitātes Matemātikas un informātikas institūts
  • Latvijas Universitātes Literatūras, folkloras un mākslas institūts
  • Latvijas Universitāte
  • Rīgas Stradiņa universitāte
  • RTU Liepāja
  • Rēzeknes Tehnoloģiju akadēmija
  • Latvijas Nacionālā bibliotēka

Repozitorijs

  • Sākumlapa
  • Kontakti
  • Iesniegumu dzīvescikls
  • BUJ
  • Par vietni un politikas

Papildus

  • CLARIN
  • Kā pieslēgties

Šī vietne izmanto programmatūru, kas izstrādāta LINDAT/CLARIN repositorija vajadzībām un ir pieejama GitHub