• Repozitorijs
  • Meklēšana korpusā
  • Par vietni
  • CLARIN
  •  Pieteikšanās
  • English Latviešu
  • CLARIN-LV repozitorija sākumlapa
  • Skatīt vienumu
  •  
  • CLARIN-LV logo
  •   Pārlūkot  
    •    Visi repozitoriji  
      •   Izdošanas datums
      •   Autori
      •   Nosaukumi
      •   Tēmas
      •   Izdevējs
      •   Valoda
      •   Tips
      •   Tiesību etiķete
  •   Mans konts  
    •    Pieteikšanās
  •   Statistika  
    •    Statistika BETA
  •   Vispārīga informācija  
    •    Deponēt
    •    Citēt
    •    Iesniegšanas dzīves cikls
    •    Bieži uzdotie jautājumi
    •    Par
    •    Palīdzības dienests
 
 

Latvian Web Corpus 2007

 
CLARIN Centre of Latvian language resources and tools
  Autori
Džeriņš, Jānis and Džonsons, Kristaps
  Vienuma identifikators
http://hdl.handle.net/20.500.12574/46
 Demonstrācijas URL
http://nosketch.korpuss.lv/#dashboard?corpname=timeklis
 Norāde
http://www.semti-kamols.lv/doc_upl/Kamols-Kaunas-paper-2.pdf
 Izdošanas datums
2007
 Tips
corpus, text
 Lielums
123000000 tokens
 Valoda(-s)
Latvian
 Apraksts
The Latvian Web Corpus 2007 contains 700,000 Latvian webpages published before 2005. The corpus is automatically annotated. Repetitions are not included.
 Izdevējs
AiLab IMCS UL
 Atbalsts

State research programme

Projekta kods: State research programme

Projekta nosaukums: Research and Development of the Semantic Web Technologies for Latvia (SemTi-Kamols)

 Tēma(-s)
text web morphology
 Kolekcija (s)
Language resources and tools of AiLab IMCS UL
Rādīt pilnu ierakstu
 
 

Partneri, koordinācija, finansējums

  • Latvijas Universitātes Matemātikas un informātikas institūts
  • Latvijas Universitātes Literatūras, folkloras un mākslas institūts
  • Latvijas Universitāte
  • Rīgas Stradiņa universitāte
  • RTU Liepāja
  • Rēzeknes Tehnoloģiju akadēmija
  • Latvijas Nacionālā bibliotēka

Repozitorijs

  • Sākumlapa
  • Kontakti
  • Iesniegumu dzīvescikls
  • BUJ
  • Par vietni un politikas

Papildus

  • CLARIN
  • Kā pieslēgties

Šī vietne izmanto programmatūru, kas izstrādāta LINDAT/CLARIN repositorija vajadzībām un ir pieejama GitHub