Bieži uzdotie jautājumi



Kas ir repozitorijs?

Tā ir kā lingvistisko datu un rīku bibliotēka.

  • Meklējiet datus un rīkus un vienkārši lejupielādējiet tos.
  • Deponējiet datus un esiet drošs, ka tie tiek droši uzglabāti, ikviens var tos atrast, izmantot un pareizi atsaukties

Kādus iesniegumus mēs pieņemam?

Mēs pieņemam jebkādus lingvistiskos un/vai NEPLP datus un rīkus: korpusus, sintaktiski marķētus korpusus, leksiskus, arī apmācītus valodas modeļus, marķētājus, analizatorus, MT sistēmas, lingvistiskos tīmekļa pakalpojumus utt. Mēs neprasām, lai jūs augšupielādētu datus pats, lai gan vienmēr ir labāk to izdarīt pašiem. Tomēr, ja nepieciešams, varat izveidot tikai metadatu ierakstu. Mēs atbalstām arī tiešsaistes licences parakstīšanu tūlītējai ierobežoto resursu pieejamībai.

Augšupielādējot valodas resursus, lūdzu, mēģiniet izmantot kādu no LRT standartos minētajiem ieteicamajiem formātiem.

Vai ir jāizveido konts, lai lejupielādētu resursus un/vai iesniegtu tos?

  • Datus un rīkus var lejupielādēt ar licenci, kas ļauj veikt bezmaksas kopīgot tos. Vienkārši izlasiet licenci un lejupielādējiet. Tas attiecas uz visiem datiem ar Creative Commons un rīkiem ar atvērtā avota licencēm.
  • Lai lejupielādētu datus un rīkus, kas pieprasa parakstīt licenci, ir jāpiesakās sistēmā. Lai izveidotu iesniegumu, ir jāpiesakās sistēmā. Tomēr, ja esat no akadēmiskās pasaules, jums, iespējams, nav vajadzīgs jauns konts.
  • Vienkārši noklikšķiniet uz “Pieteikties” un meklējiet savu akadēmisko iestādi. Lai pierakstītos, varat izmantot jebkuru kontu ar identitātes nodrošinātāju, kas ir EduGAIN federācijas dalībnieks.
  • Ja jums nav akadēmiskā konta, tad informējiet mūs. Mēs jums izveidosim vietējo kontu.

Tiek rādīta kļūda, piesakoties sistēmā

Lūdzu, informējiet mūs, izmantojot palīdzības dienestu, ja jums ir kādas problēmas ar pieteikšanos.

Reizēm (ja esat pirmais, kas piesakās, izmantojot savu vietējo iestādi), iespējams, redzēsit kļūdu, kurā norādīts: "Autentifikācija bija veiksmīga; tomēr identitātes nodrošinātājs nenodrošināja ne jūsu e-pasta ziņojumu, ne e-pasta ziņojumu, ne mērķa ID." Tas nozīmē, ka jūsu vietējā iestāde mums nav nosūtījusi pietiekami daudz datu par jums, lai izmantotu mūsu pakalpojumu; iestāde to dara, lai aizsargātu jūsu personas datus. Mums ir nepieciešams tikai e-pasts, un mēs ievērojam Datu aizsardzības rīcības kodeksu, kas palīdz pārliecināt iestādi, ka mēs neizmantosim datus par jums.

Ja jums ir konts ar vairākiem pakalpojumu sniedzējiem un jūs katru reizi piesakāties ar citu, iespējams, redzēsit kļūdas ziņojumu “Jūsu e-pasts jau ir saistīts ar citu lietotāju”. Lūdzu, katru reizi mēģiniet izmantot vienu un to pašu pakalpojumu sniedzēju, ja tas nav iespējams, informējiet mūs, un mēs mainīsim noklusējuma pakalpojumu sniedzēju.

Kāpēc ir jāiesniedz dati jūsu repozitorijā?

  • Tas ir brīvs un drošs.
  • Mēs cienām jūsu licenci. Mēs sekmējam bezmaksas datus un uzskatām, ka tie sniedz labumu ne tikai lietotājiem, bet arī datu sniedzējiem. Tomēr mēs pieņemam arī vairāk slēgtu datu un varam likt lietotājiem parakstīt licenci pirms jūsu datu lejupielādes, ja tas ir nepieciešams.
  • Dati ir redzami, sniedzot maksimālu atbalstu jūsu darbam (google, VLO, DataCite, OLAC, Data Citation Index, arXive).
  • Datus ir viegli citēt. Mēs piedāvājam lietošanai gatavus viena klikšķa citātus BibTex, RIS un citos populāros atsauču formātos. Visi citāti ietver pastāvīgas saites, kas izveidotas no pastāvīgiem identifikatoriem (mēs izmantojam PID turus). Šie PID ir nākotnē droši.
  • Dažiem datiem, piemēram, korpusiem vai sintaktiski marķētiem korpusiem, mēs varam nodrošināt papildu pakalpojumus, piemēram, pilna teksta vai pat koka vaicājumu meklēšanu.

Kāpēc ir jāiesniedz mani rīki?

  • Skatiet sadaļu “Kāpēc jāiesniedz dati jūsu repozitorijā?”. Tas viss attiecas arī uz programmatūras rīkiem.
  • Jūs varat vienkārši saistīt savu versiju kontroles sistēmu (svn, git), ja tā ir publiski pieejama. Varat arī saistīt savu projekta lapu vai demonstrācijas vietni.

Kam paredzēts PID (turis)?

Tas ir īpašs pastāvīgs URL. Tas nodrošina pastāvīgu saiti, kas atrisināsies pareizi pat tad, ja kādā tālā nākotnē dati tiks pārvietoti. Tādējādi citātos tas būtu jāizmanto kā URL.

Kāda ir faktiskā deponēšanas/arhivēšanas procedūra?

Iesniedzot digitālos valodas resursus repozitorijam, datus saglabā, lai nodrošinātu kvalitāti un konsekvenci. Mēs palīdzam jums izpildīt ilgtspējīgas resursu arhivēšanas prasības. Dati ir jānodrošina ar metadatiem standarta formātos, kas ir pieņemti attiecīgajās kopienās, ir jāpiešķir pastāvīgi identifikatori (PID), jārisina intelektuālā īpašuma tiesību jautājumi un jāsniedz skaidri paziņojumi par licencēšanu un iespējamo resursu izmantošanu. Glabātājam ir arī elektroniski jāparaksta glabāšanas līgums, kas apliecina, ka viņam ir tiesības uz datiem, un ka viņam ir tiesības piešķirt šajā licencē paredzētās tiesības. Kad dati patiešām ir deponēti repozitorijā, tiem tiek piešķirts PID stabilai atsaucei.

Kā rīkoties, ja vēlaties/nepieciešams atjaunināt arhivētos datus?

Visas izmaiņas resursos un metadatos ir jāsaglabā kā jauna versija ar jaunu PID. Tomēr, ja izmaiņas ir minimālas (piemēram, drukas kļūdas vai skaidras kļūdas), sazinieties ar mūsu palīdzības dienestu, izmantojot iesniegšanas PID un veicamās izmaiņas. Pārskatītājam ir jāizlemj, vai šo izmaiņu dēļ ir jābūt jaunai versijai.

Ko darīt, ja nākotnē vēlos noņemt resursus? Vai datus var izdzēst?

Jā, šajā gadījumā sazinieties ar mūsu palīdzības dienestu ar iesniegšanas PID un iemeslu. Tomēr mums ir jāsaglabā atsauce, ka dati ir bijuši mūsu repozitorijā (tāpēc, ka tika izdots pastāvīgs identifikators), tāpēc tiks saglabāti administratīvie metadati, kas norāda, ka dati ir noņemti.

Mēs esam sākuši veidot savu repozitoriju, vai mēs kaut kādā veidā varam pārvietot ierakstus, kas iesniegti LRT kolekcijai?

Pārvietotajam ierakstam mēs varam izveidot nemaināmu lapu, un mēs šai lapai varam pievienot paziņojumu, norādot, ka resurss tagad atrodas jaunā vietā. Iesniegums tiek efektīvi slēpts no meklēšanas, pārlūkošanas un ieguves (oai-pmh), bet PID joprojām tiek atrisināts. Tādējādi faktisko datu vietā jūsu repozitorijā tiek rādīta saite uz vienumu. Lai iegūtu plašāku informāciju, sazinieties ar palīdzības dienestu.

Es nevēlos padarīt datus publiski pieejamus vai padarīt tos pieejamus pēc noteikta datuma. Vai jūs joprojām tos man arhivētu?

Saskaņā ar pētniecības infrastruktūru atbalstīšanu un vispārējo attīstību attiecībā uz atvērto piekļuvi mēs mudinām datu veidotājus būt pēc iespējas atvērtākiem. Tomēr citos gadījumos mēs arhivēsim jūsu datus pat tad, ja tie nebūs publiski pieejami. Lūdzu, sazinieties ar mūsu palīdzības dienestu, pirms tiek pabeigta iesniegšana.

Kā atsaukties uz iesniegumus?

Skatiet mūsu politikas.

Cik droši ir mani dati, ja es tos glabāju pie jums?

Diezgan droši, droši vien daudz vairāk nekā datorā. Mūsu glabāšanas plāns:

  • Visiem repozitorija datiem ir dublējumkopija uz vietas.
  • Ir vēl viena ārpusobjekta kopija, tāpēc pat pilnīga mūsu ēkas iznīcināšana neiznīcina jūsu datus.
  • Mēs regulāri pārbaudām visus eksemplārus, un, ja kāds no tiem ir bojāts, mēs to izdzēšam un izveidojam jaunu.
  • Mēs vienmēr glabājam vismaz trīs eksemplārus, vienu no tiem ārpus uzņēmuma

Kādu licenci izvēlēties saviem datiem/rīkam?

Mēs iesakām izmantot bezmaksas licenci. Tieši iesniegšanas laikā ir pieejama bezmaksas licenču, kā arī KC licenču (piemērotākas datiem) reprezentatīva izvēle. Ir pieejams lielisks LICENCES atlasītājs, kas var palīdzēt izvēlēties atbilstošu licenci.
Ja kaut kāda iemesla dēļ jums nepieciešama cita licence, sazinieties ar mums.

Kur var atrast papildinformāciju par atbalstītajām licencēm?

Pašlaik atbalstīto licenču saraksts ir atrodams šeit. Tomēr nevilcinieties ar mums sazināties, ja jums nepieciešama konkrēta licence. Licences var papildināt ar dažādām prasībām; piem., ierobežot pieteikšanos lietotājiem, aizpildīt papildu detaļas,mērķi utt.

Kāpēc mēs dodam priekšroku reāliem autoriem, nevis iestādēm?

Runa nav par saziņu, bet gan par citējamību un uzticamību. Tāpēc mums ir atsevišķi metadatu lauki autoriem un kontaktpersonai. Saziņa ar palīdzības dienestu ir laba lieta, savukārt autora nenorādīšana nav pieļaujama. Mēs atbalstām datu tiešu citēšanu (https://www.force11.org/datacitation). Tieši tāpēc mēs arī viņiem dodam PID, veidojam formatētas atsauces utt. Tas ir iemesls, kāpēc mēs tiešām vēlamies pareizus autorus, lai viņi saņemtu atsauces un citi zinātnieki zinātu, uz kuru darbu viņi paļaujas.

Kā es varu maksimāli izmantot savus meklēšanas vaicājumus?

Atšķirībā no citām meklētājprogrammām, ko izmanto, vai kā noklusējuma operatoru; skatiet piemērus, kas to precizē. Ja neesat apmierināts ar meklēšanas rezultātiem, iespējams, vēlēsities iziet ārpus vienkārša teksta meklēšanas. Varat meklēt tikai noteiktos laukos, izmantot noliegumu, pievienot punktus dažām vaicājuma daļām un daudz vairāk. Meklētājprogramma ir SOLR, tāpēc izmantojiet tās sintaksi, ja to zināt, vai pārbaudiet dokumentācijā.

Piemēri

PDT wordnet pret PDT UN wordnet
Noklusējuma operators ir VAI; t. i., pirmais piemērs meklē PDT VAI WordNet visos teksta laukos.
dc.nosaukums:P?T && - dc.title: WordNet
Atgriež visus vienumus, kuriem ir P? T nosaukumā -? apzīmē jebkuru rakstzīmi (piem., PDT) - un nav WordNet virsrakstā
dc.nosaukums: “Czech WordNet”
Precīzām atbilstībām un vairākvārdu izteiksmēm izmantot dubultās pēdiņas (")
autors: (Bojar && -Tamchyna) && (dc.language.iso: (ces AND eng) VAI valoda: (czech UN english))
Meklēt vienumus pēc viena autora, nevis cita; interesē tikai vienumi čehu un angļu valodai.