• Repozitorijs
  • Meklēšana korpusā
  • Par vietni
  • CLARIN
  •  Pieteikšanās
  • English Latviešu
  • CLARIN-LV repozitorija sākumlapa
  • Skatīt vienumu
  •  
  • CLARIN-LV logo
  •   Pārlūkot  
    •    Visi repozitoriji  
      •   Izdošanas datums
      •   Autori
      •   Nosaukumi
      •   Tēmas
      •   Izdevējs
      •   Valoda
      •   Tips
      •   Tiesību etiķete
  •   Mans konts  
    •    Pieteikšanās
  •   Statistika  
    •    Statistika BETA
  •   Vispārīga informācija  
    •    Deponēt
    •    Citēt
    •    Iesniegšanas dzīves cikls
    •    Bieži uzdotie jautājumi
    •    Par
    •    Palīdzības dienests
 
 

SELMA Open Source Platform (UC0)

 
CLARIN Centre of Latvian language resources and tools
  Autori
Goško, Didzis and Bārzdiņš, Guntis
  Vienuma identifikators
http://hdl.handle.net/20.500.12574/97
 Projekta URL
https://selma-project.eu
 Demonstrācijas URL
https://selma.ailab.lv
 Norāde
https://selma-project.eu/2023/10/18/the-selma-open-source-platform/
https://github.com/SELMA-project/UC0-OpenSource
 Izdošanas datums
2024-02
 Tips
toolService
 Apraksts
The SELMA Open-Source Software (OSS) offers effective means to test and compare the performance of various language models used in multilingual media monitoring and content production. The SELMA OSS Platform (also referred to as Use Case 0, UC0, or The Basic Testing and Configuration Interface) provides: * automatic speech recognition (ASR) from audio/video files, * punctuation and capitalization of the transcribed text, * machine translation (MT) into a target language, * text-to-speech synthesis (TTS) and voice-over generation. To provide this functionality, the demonstrator release uses these multilingual open source models: OpenAI Whisper (ASR), Meta MMS (TTS, ASR), Meta M2M-100 (MT). Thus, it facilitates easy access to such open large language models. The SELMA Platform can be used not only by developers in order to combine and test alternative language models before they are integrated into the end-user applications – it can also be used as an entry-level application by journalists and media producers themselves to transcribe their recordings, generate subtitles and voice-over, or to generate a podcast from an input text. The demonstrator of the SELMA OSS Platform does not require registration and authentication nor does it store any content, original or generated, after the session is closed by the user.
 Izdevējs
AiLab IMCS UL
 Atbalsts

European Commission

Projekta kods: 957017

Projekta nosaukums: SELMA – Stream Learning for Multilingual Knowledge Transfer

 Tēma(-s)
ASR TTS MT multilingual content production multilingual media monitoring LLM
 Kolekcija (s)
Language resources and tools of AiLab IMCS UL
Rādīt pilnu ierakstu
 
 

Partneri, koordinācija, finansējums

  • Latvijas Universitātes Matemātikas un informātikas institūts
  • Latvijas Universitātes Literatūras, folkloras un mākslas institūts
  • Latvijas Universitāte
  • Rīgas Stradiņa universitāte
  • RTU Liepāja
  • Rēzeknes Tehnoloģiju akadēmija
  • Latvijas Nacionālā bibliotēka

Repozitorijs

  • Sākumlapa
  • Kontakti
  • Iesniegumu dzīvescikls
  • BUJ
  • Par vietni un politikas

Papildus

  • CLARIN
  • Kā pieslēgties

Šī vietne izmanto programmatūru, kas izstrādāta LINDAT/CLARIN repositorija vajadzībām un ir pieejama GitHub