Bieži uzdotie jautājumi



Kas ir repozitorijs?

Repozitorijs ir kā lingvistisko datu un rīku bibliotēka.

  • Meklējiet datus un rīkus un vienkārši lejupielādējiet tos.
  • Deponējiet datus un esiet drošs, ka tie tiek droši uzglabāti, ikviens var tos atrast, izmantot un pareizi atsaukties

Kādus iesniegumus mēs pieņemam?

Mēs pieņemam jebkādus lingvistiskos un/vai valodas tehnoloģiju datus un rīkus: korpusus, sintaktiski marķētus korpusus, leksiku, kā arī apmācītus valodas modeļus, tagotājus, analizatorus, mašīntulkošanas sistēmas, lingvistiskos tīmekļa pakalpojumus utt. Mēs neprasām, lai jūs augšupielādētu datus, lai gan vienmēr ir labāk to izdarīt. Tomēr, ja nepieciešams, varat izveidot tikai metadatu ierakstu. Mēs atbalstām arī tiešsaistes licences parakstīšanu tūlītējai ierobežoto resursu pieejamībai.

Augšupielādējot valodas resursus, lūdzu, mēģiniet izmantot kādu no Valodas resursu un rīku (LRT) standartos minētajiem ieteicamajiem formātiem.

Vai ir jāizveido konts, lai lejupielādētu resursus un/vai iesniegtu tos?

  • Datus un rīkus var lejupielādēt, ja tie licencēti ar licenci, kas ļauj tos brīvi kopīgot. Vienkārši izlasiet licenci un lejupielādējiet. Tas attiecas uz visiem datiem ar Creative Commons licenci un rīkiem ar atvērtā koda licencēm.
  • Lai lejupielādētu datus un rīkus, kas pieprasa parakstīt licenci, ir jāpiesakās sistēmā. Lai iesniegtu valodas resursus, arī ir jāpiesakās sistēmā. Tomēr, ja esat no akadēmiskās pasaules, jums, iespējams, nav vajadzīgs jauns konts.
  • Vienkārši noklikšķiniet uz “Pieteikties” un meklējiet savu akadēmisko iestādi. Lai pierakstītos, varat izmantot jebkuru kontu ar identitātes nodrošinātāju, kas ir EduGAIN federācijas dalībnieks.
  • Ja jums nav akadēmiskā konta, tad informējiet mūs. Mēs jums izveidosim vietējo kontu.

Tiek rādīta kļūda, piesakoties sistēmā

Lūdzu, informējiet mūs, izmantojot palīdzības dienestu, ja jums ir kādas problēmas ar pieteikšanos.

Reizēm (parasti,ja esat pirmais, kas piesakās no savas iestādes) varat redzēt kļūdu, kurā norādīts: "Autentifikācija bija veiksmīga; tomēr identitātes nodrošinātājs nenodrošināja ne jūsu e-pasta adresi, ne e-pasta ziņojumu, ne identifikatoru (ID)." Tas nozīmē, ka jūsu iestāde mums nav nosūtījusi pietiekami daudz datu par jums, lai izmantotu mūsu pakalpojumu; iestāde to dara, lai aizsargātu jūsu personas datus. Mums ir nepieciešams tikai e-pasta adrese, un mēs ievērojam Datu aizsardzības rīcības kodeksu, kas palīdz pārliecināt iestādi, ka mēs neizmantosim datus par jums.

Ja jums ir konts ar vairākiem pakalpojumu sniedzējiem un jūs katru reizi piesakāties ar citu, iespējams, redzēsit kļūdas ziņojumu “Jūsu e-pasts jau ir saistīts ar citu lietotāju”. Lūdzu, mēģiniet izmantot vienu un to pašu pakalpojumu sniedzēju, ja tas nav iespējams, informējiet mūs, un mēs mainīsim noklusējuma pakalpojumu sniedzēju.

Kāpēc ir jāiesniedz dati repozitorijā?

  • Tas ir bez maksas un droši.
  • Mēs respektējam jūsu licenci. Mēs atbalstām bezmaksas datus un uzskatām, ka tie sniedz labumu ne tikai lietotājiem, bet arī datu sniedzējiem. Tomēr mēs atbalstām arī slēgtākus datus un varam likt lietotājiem parakstīt licenci pirms jūsu datu lejupielādes, ja tas ir nepieciešams.
  • Dati ir redzami, sniedzot maksimālu atbalstu jūsu darbam (google, VLO, DataCite, OLAC, Data Citation Index, arXive).
  • Datus ir viegli citēt. Mēs piedāvājam lietošanai gatavus viena klikšķa citātus BibTex, RIS un citos populāros atsauču formātos. Visi citāti ietver pastāvīgas saites, kas izveidotas no pastāvīgiem identifikatoriem (mēs izmantojam PID turus). Šie PID ir nākotnē droši.
  • Dažiem datiem, piemēram, korpusiem vai sintaktiski marķētiem korpusiem, mēs varam nodrošināt papildu pakalpojumus, piemēram, pilna teksta vai pat koka vaicājumu meklēšanu.

Kāpēc ir jāiesniedz rīki?

  • Skatiet sadaļu “Kāpēc jāiesniedz dati repozitorijā?”. Tas viss attiecināms arī uz programmatūras rīkiem.
  • Jūs varat vienkārši saistīt savu versiju kontroles sistēmu (svn, git), ja tā ir publiski pieejama. Varat arī saistīt savu projekta lapu vai demonstrācijas vietni.

Kam paredzēts PID (turis)?

Tas ir īpašs pastāvīgs URL. Tas nodrošina pastāvīgu saiti, kas atrisināsies pareizi pat tad, ja tālā nākotnē dati tiks pārvietoti. Tādējādi citātos tas būtu jāizmanto kā URL.

Kāda ir faktiskā deponēšanas/arhivēšanas procedūra?

Iesniedzot digitālos valodas resursus repozitorijam, datus saglabā, lai nodrošinātu kvalitāti un konsekvenci. Mēs palīdzam jums izpildīt ilgtspējīgas resursu arhivēšanas prasības. Dati ir jānodrošina ar metadatiem standarta formātos, kas ir pieņemti attiecīgajās kopienās, ir jāpiešķir pastāvīgi identifikatori (PID), jārisina intelektuālā īpašuma tiesību jautājumi un jāsniedz skaidri paziņojumi par licencēšanu un iespējamo resursu izmantošanu. Glabātājam ir arī elektroniski jāparaksta glabāšanas līgums, kas apliecina, ka viņam ir tiesības uz datiem, un ka viņam ir tiesības piešķirt šajā licencē paredzētās tiesības. Kad dati patiešām ir deponēti repozitorijā, tiem tiek piešķirts PID stabilai atsaucei.

Kā rīkoties, ja vēlaties/nepieciešams atjaunināt arhivētos datus?

Visas izmaiņas resursos un metadatos ir jāsaglabā kā jauna versija ar jaunu PID. Tomēr, ja izmaiņas ir minimālas (piemēram, drukas kļūdas), sazinieties ar mūsu palīdzības dienestu, norādot iesniegšanas PID un veicamās izmaiņas. Pārskatītājam ir jāizlemj, vai šo izmaiņu dēļ ir jābūt jaunai versijai.

Ko darīt, ja nākotnē vēlos atsaukt resursus? Vai datus var izdzēst?

Jā, šajā gadījumā sazinieties ar mūsu palīdzības dienestu, norādot iesniegšanas PID un iemeslu. Tomēr mums ir jāsaglabā atsauce, ka dati ir bijuši mūsu repozitorijā (tāpēc, ka tika izdots pastāvīgs identifikators), tāpēc tiks saglabāti administratīvie metadati, kas norāda, ka dati ir atsaukti.

Mēs esam sākuši veidot savu repozitoriju, vai mēs kaut kādā veidā varam pārvietot ierakstus, kas iesniegti LRT kolekcijai?

Pārvietotajam ierakstam mēs varam izveidot nemaināmu lapu, un mēs šai lapai varam pievienot paziņojumu, norādot, ka resurss tagad atrodas jaunā vietā. Iesniegums tiek efektīvi slēpts no meklēšanas, pārlūkošanas un ieguves (oai-pmh), bet PID joprojām tiek atrisināts. Tādējādi faktisko datu vietā jūsu repozitorijā tiek rādīta saite uz vienumu. Lai iegūtu plašāku informāciju, sazinieties ar palīdzības dienestu.

Es nevēlos/nevaru padarīt datus publiski pieejamus vai padarīt tos pieejamus pēc noteikta datuma. Vai jūs joprojām tos man arhivētu?

Saskaņā ar pētniecības infrastruktūru atbalstīšanu un vispārējo attīstību attiecībā uz atvērto piekļuvi mēs mudinām datu veidotājus būt pēc iespējas atvērtākiem. Tomēr mēs arhivēsim jūsu datus pat tad, ja tie nebūs publiski pieejami. Lūdzu, sazinieties ar mūsu palīdzības dienestu, pirms tiek pabeigta iesniegšana.

Kā atsaukties uz iesniegumus?

Skatiet mūsu politikas.

Cik droši ir mani dati, ja es tos glabāju pie jums?

Diezgan droši, droši vien daudz drošāk nekā datorā. Mūsu glabāšanas plāns:

  • Visiem repozitorija datiem ir dublējumkopija uz vietas.
  • Ir vēl viena ārpusobjekta kopija, tāpēc pat pilnīga mūsu ēkas iznīcināšana neiznīcina jūsu datus.
  • Mēs regulāri pārbaudām visus eksemplārus, un, ja kāds no tiem ir bojāts, mēs to izdzēšam un izveidojam jaunu.
  • Mēs vienmēr glabājam vismaz trīs eksemplārus, vienu no tiem ārpus uzņēmuma.

Kādu licenci izvēlēties saviem datiem/rīkam?

Mēs iesakām izmantot bezmaksas licenci. Tieši iesniegšanas laikā ir pieejama bezmaksas licenču, kā arī 'Creative Common' licenču (piemērotākas datiem) reprezentatīva izvēle. Ir pieejams lielisks LICENCES atlasītājs, kas var palīdzēt izvēlēties atbilstošu licenci.
Ja kaut kāda iemesla dēļ jums nepieciešama cita licence, sazinieties ar mums.

Kur var atrast papildinformāciju par atbalstītajām licencēm?

Pašlaik atbalstīto licenču saraksts ir atrodams šeit. Tomēr nevilcinieties sazināties ar mums, ja jums nepieciešama konkrēta licence. Licences var papildināt ar dažādām prasībām; piem., atļaut piekļuvi tikai lietotājiem, kas pieteikušies, aizpildīt papildu detaļas (mērķi) utt.

Kāpēc mēs dodam priekšroku reāliem autoriem, nevis iestādēm?

Runa nav par saziņu, bet gan par citējamību un uzticamību. Tāpēc mums ir atsevišķi metadatu lauki autoriem un kontaktpersonai. Saziņa ar palīdzības dienestu ir laba lieta, savukārt autora nenorādīšana nav pieļaujama. Mēs atbalstām datu tiešu citēšanu (https://www.force11.org/datacitation). Tieši tāpēc mēs piešķiram PID, veidojam formatētas atsauces utt. Tas ir iemesls, kāpēc mēs tiešām vēlamies īstos autorus, lai viņi saņemtu atsauces un citi zinātnieki zinātu, uz kuru darbu viņi paļaujas.

Kā es varu maksimāli izmantot savus meklēšanas vaicājumus?

Atšķirībā no citām meklētājprogrammām, šī meklētājprogramma izmanto 'VAI' kā noklusējuma operatoru; skatiet zamāk piemērus, kas to izskaidro. Ja neesat apmierināts ar meklēšanas rezultātiem, iespējams, vēlēsities izmantot ko vairāk nekā vienkāršu teksta meklēšanu. Varat meklēt tikai noteiktos laukos, izmantot noliegumu, un daudz ko citu. Meklētājprogramma ir SOLR, tāpēc izmantojiet tās sintaksi, ja to zināt, vai pārbaudiet dokumentācijā.

Piemēri

Latvian corpus pret Latvian AND corpus
Noklusējuma operators ir VAI; t. i., pirmais piemērs meklē Latvian vai corpus visos teksta laukos.
dc.nosaukums:Latvian && - dc.title: corpus
Atgriež visus vienumus, kuriem ir Latvian nosaukumā un nav corpus virsrakstā
dc.title: “Historical dictionary”
Precīzām atbilstībām un vairākvārdu izteiksmēm izmantot dubultās pēdiņas (")
author: (Levāne-Petrova && -Darģis) && (dc.language.iso:(lav AND lit) OR language:(latvian AND lithuanian))
Meklēt vienumus pēc pirmā autora, bet ne pēc otrā; interesē tikai vienumi lietuviešu un latviešu valodai.