Zobrazit minimální záznam

 
dc.contributor.author Ramisch, Carlos
dc.contributor.author Cordeiro, Silvio Ricardo
dc.contributor.author Savary, Agata
dc.contributor.author Vincze, Veronika
dc.contributor.author Barbu Mititelu, Verginica
dc.contributor.author Bhatia, Archna
dc.contributor.author Buljan, Maja
dc.contributor.author Candito, Marie
dc.contributor.author Gantar, Polona
dc.contributor.author Giouli, Voula
dc.contributor.author Güngör, Tunga
dc.contributor.author Hawwari, Abdelati
dc.contributor.author Iñurrieta, Uxoa
dc.contributor.author Kovalevskaitė, Jolanta
dc.contributor.author Krek, Simon
dc.contributor.author Lichte, Timm
dc.contributor.author Liebeskind, Chaya
dc.contributor.author Monti, Johanna
dc.contributor.author Parra Escartín, Carla
dc.contributor.author QasemiZadeh, Behrang
dc.contributor.author Ramisch, Renata
dc.contributor.author Schneider, Nathan
dc.contributor.author Stoyanova, Ivelina
dc.contributor.author Vaidya, Ashwini
dc.contributor.author Walsh, Abigail
dc.contributor.author Aceta, Cristina
dc.contributor.author Aduriz, Itziar
dc.contributor.author Antoine, Jean-Yves
dc.contributor.author Arhar Holdt, Špela
dc.contributor.author Berk, Gözde
dc.contributor.author Bielinskienė, Agnė
dc.contributor.author Blagus, Goranka
dc.contributor.author Boizou, Loic
dc.contributor.author Bonial, Claire
dc.contributor.author Caruso, Valeria
dc.contributor.author Čibej, Jaka
dc.contributor.author Constant, Matthieu
dc.contributor.author Cook, Paul
dc.contributor.author Diab, Mona
dc.contributor.author Dimitrova, Tsvetana
dc.contributor.author Ehren, Rafael
dc.contributor.author Elbadrashiny, Mohamed
dc.contributor.author Elyovich, Hevi
dc.contributor.author Erden, Berna
dc.contributor.author Estarrona, Ainara
dc.contributor.author Fotopoulou, Aggeliki
dc.contributor.author Foufi, Vassiliki
dc.contributor.author Geeraert, Kristina
dc.contributor.author van Gompel, Maarten
dc.contributor.author Gonzalez, Itziar
dc.contributor.author Gurrutxaga, Antton
dc.contributor.author Ha-Cohen Kerner, Yaakov
dc.contributor.author Ibrahim, Rehab
dc.contributor.author Ionescu, Mihaela
dc.contributor.author Jain, Kanishka
dc.contributor.author Jazbec, Ivo-Pavao
dc.contributor.author Kavčič, Teja
dc.contributor.author Klyueva, Natalia
dc.contributor.author Kocijan, Kristina
dc.contributor.author Kovács, Viktória
dc.contributor.author Kuzman, Taja
dc.contributor.author Leseva, Svetlozara
dc.contributor.author Ljubešić, Nikola
dc.contributor.author Malka, Ruth
dc.contributor.author Markantonatou, Stella
dc.contributor.author Martínez Alonso, Héctor
dc.contributor.author Matas, Ivana
dc.contributor.author McCrae, John
dc.contributor.author de Medeiros Caseli, Helena
dc.contributor.author Onofrei, Mihaela
dc.contributor.author Palka-Binkiewicz, Emilia
dc.contributor.author Papadelli, Stella
dc.contributor.author Parmentier, Yannick
dc.contributor.author Pascucci, Antonio
dc.contributor.author Pasquer, Caroline
dc.contributor.author Pia di Buono, Maria
dc.contributor.author Puri, Vandana
dc.contributor.author Raffone, Annalisa
dc.contributor.author Ratori, Shraddha
dc.contributor.author Riccio, Anna
dc.contributor.author Sangati, Federico
dc.contributor.author Shukla, Vishakha
dc.contributor.author Simkó, Katalin
dc.contributor.author Šnajder, Jan
dc.contributor.author Somers, Clarissa
dc.contributor.author Srivastava, Shubham
dc.contributor.author Stefanova, Valentina
dc.contributor.author Taslimipoor, Shiva
dc.contributor.author Theoxari, Natasa
dc.contributor.author Todorova, Maria
dc.contributor.author Urizar, Ruben
dc.contributor.author Villavicencio, Aline
dc.contributor.author Zilio, Leonardo
dc.date.accessioned 2018-08-16T11:45:05Z
dc.date.available 2018-08-16T11:45:05Z
dc.date.issued 2018-04-30
dc.identifier.uri http://hdl.handle.net/11372/LRT-2842
dc.description This multilingual resource contains corpora in which verbal MWEs have been manually annotated. VMWEs include idioms (let the cat out of the bag), light-verb constructions (make a decision), verb-particle constructions (give up), inherently reflexive verbs (help oneself), and multi-verb constructions (make do). VMWEs were annotated according to the universal guidelines in 19 languages. The corpora are provided in the cupt format, inspired by the CONLL-U format. The corpora were used in the 1.1 edition of the PARSEME Shared Task (2018). For most languages, morphological and syntactic information ­­­­– not necessarily using UD tagsets – including parts of speech, lemmas, morphological features and/or syntactic dependencies are also provided. Depending on the language, the information comes from treebanks (e.g., Universal Dependencies) or from automatic parsers trained on treebanks (e.g., UDPipe). This item contains training, development and test data, as well as the evaluation tools used in the PARSEME Shared Task 1.1 (2018). The annotation guidelines are available online: http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1
dc.language.iso bul
dc.language.iso deu
dc.language.iso ell
dc.language.iso spa
dc.language.iso fas
dc.language.iso fra
dc.language.iso heb
dc.language.iso hun
dc.language.iso ita
dc.language.iso lit
dc.language.iso pol
dc.language.iso por
dc.language.iso ron
dc.language.iso slv
dc.language.iso tur
dc.language.iso hin
dc.language.iso eus
dc.language.iso eng
dc.language.iso hrv
dc.publisher PARSEME
dc.relation.isreferencedby http://aclweb.org/anthology/W18-4925
dc.relation.replaces http://hdl.handle.net/11372/LRT-2282
dc.relation.isreplacedby http://hdl.handle.net/11234/1-3367
dc.rights PARSEME Shared Task Data (v. 1.1) Agreement
dc.rights.uri https://lindat.mff.cuni.cz/repository/xmlui/page/licence-mwe-1.1
dc.source.uri http://multiword.sf.net/sharedtask2018
dc.subject Multiword expressions
dc.subject verbal multiword expressions
dc.subject light-verb constructions
dc.subject verb-particle constructions
dc.subject inherently reflexive verbs
dc.subject verbal idioms
dc.subject multi-verb constructions
dc.title Annotated corpora and tools of the PARSEME Shared Task on Automatic Identification of Verbal Multiword Expressions (edition 1.1)
dc.type corpus
metashare.ResourceInfo#ContentInfo.mediaType text
dc.rights.label PUB
has.files yes
branding LRT + Open Submissions
contact.person Carlos Ramisch carlos.ramisch@lis-lab.fr Aix-Marseille University
contact.person Agata Savary agata.savary@univ-tours.fr Université de Tours
contact.person Silvio Cordeiro silvioricardoc@gmail.com Aix-Marseille University
size.info 277701 sentences
size.info 5807087 tokens
size.info 75107 multiWordUnits
files.size 77632731
files.count 22


 Soubory tohoto záznamu

 Stáhnout všechny soubory záznamu (74.04 MB)
Licenční kategorie:
Publicly Available

Licence: PARSEME Shared Task Data (v. 1.1) Agreement
GNU General Public License, version 3.0 Distributed under Creative Commons
Icon
Název
README.md
Velikost
5.95 KB
Formát
Neznámý
Popis
Overall description
MD5
829b0937130ce28abc179a9619e88e9c
 Stáhnout soubor
Icon
Název
bin.tgz
Velikost
19.6 KB
Formát
application/x-gzip
Popis
Evaluation scripts
MD5
45e16f3ea085b9d64b2839046327a1b6
 Stáhnout soubor  Náhled
 Náhled souboru  
  • bin
    • validate_cupt.py4 kB
    • bmc_munkres
      • LICENSE561 B
      • README.md1 kB
      • munkres.py23 kB
    • evaluate.py23 kB
    • average_of_evaluations.py6 kB
    • parsemetsv2cupt.py2 kB
    • tsvlib.py11 kB
Icon
Název
trial.tgz
Velikost
4.74 KB
Formát
application/x-gzip
Popis
Trial files (English)
MD5
8d3fbcfe9a832e66c1a4e61dce8d1f14
 Stáhnout soubor  Náhled
 Náhled souboru  
  • trial
    • EN_trial-test_gold.cupt8 kB
    • EN_trial-test_pred.cupt8 kB
    • EN_trial-train.cupt7 kB
Icon
Název
BG.tgz
Velikost
6.38 MB
Formát
application/x-gzip
Popis
Bulgarian files
MD5
2c42058921f4f2aa09402fcbb7494077
 Stáhnout soubor  Náhled
 Náhled souboru  
  • BG
    • test.blind.cupt3 MB
    • dev-stats.md185 B
    • train-stats.md195 B
    • README.md1 kB
    • dev.cupt3 MB
    • test-stats.md185 B
    • train.cupt34 MB
    • test.cupt3 MB
Icon
Název
DE.tgz
Velikost
2.38 MB
Formát
application/x-gzip
Popis
German files
MD5
b28e381834aa389e074f184733fcfb57
 Stáhnout soubor  Náhled
 Náhled souboru  
  • DE
    • test.blind.cupt1 MB
    • dev-stats.md208 B
    • train-stats.md217 B
    • README.md3 kB
    • dev.cupt1 MB
    • test-stats.md209 B
    • train.cupt8 MB
    • test.cupt1 MB
Icon
Název
EL.tgz
Velikost
3.4 MB
Formát
application/x-gzip
Popis
Greek files
MD5
36f6602138c4bfb397baea31f8ecf7a7
 Stáhnout soubor  Náhled
 Náhled souboru  
  • EL
    • test.blind.cupt3 MB
    • dev-stats.md187 B
    • train-stats.md193 B
    • README.md2 kB
    • dev.cupt5 MB
    • test-stats.md190 B
    • train.cupt11 MB
    • test.cupt3 MB
Icon
Název
EN.tgz
Velikost
2.05 MB
Formát
application/x-gzip
Popis
English files
MD5
561093f4482a52e05f58482e6f98599e
 Stáhnout soubor  Náhled
 Náhled souboru  
  • EN
    • test.blind.cupt3 MB
    • train-stats.md209 B
    • README.md1 kB
    • test-stats.md223 B
    • train.cupt2 MB
    • test.cupt3 MB
Icon
Název
ES.tgz
Velikost
2.55 MB
Formát
application/x-gzip
Popis
Spanish files
MD5
69e4ec35058e366b45a7316987353319
 Stáhnout soubor  Náhled
 Náhled souboru  
  • ES
    • test.blind.cupt3 MB
    • dev-stats.md198 B
    • train-stats.md205 B
    • README.md2 kB
    • dev.cupt1 MB
    • test-stats.md218 B
    • train.cupt5 MB
    • test.cupt3 MB
Icon
Název
EU.tgz
Velikost
2.05 MB
Formát
application/x-gzip
Popis
Basque files
MD5
7b6178745a43a1a83f778420972ffecd
 Stáhnout soubor  Náhled
 Náhled souboru  
  • EU
    • test.blind.cupt1 MB
    • dev-stats.md157 B
    • train-stats.md163 B
    • README.md2 kB
    • dev.cupt1 MB
    • test-stats.md157 B
    • train.cupt7 MB
    • test.cupt1 MB
Icon
Název
FA.tgz
Velikost
696.13 KB
Formát
application/x-gzip
Popis
Farsi files
MD5
4c8266063c4535c71edd3dd6b7b2383c
 Stáhnout soubor  Náhled
 Náhled souboru  
  • FA
    • test.blind.cupt390 kB
    • dev-stats.md120 B
    • train-stats.md153 B
    • README.md3 kB
    • dev.cupt475 kB
    • test-stats.md121 B
    • train.cupt2 MB
    • test.cupt394 kB
Icon
Název
FR.tgz
Velikost
6.04 MB
Formát
application/x-gzip
Popis
French files
MD5
dcd671a8f7e9737fcb45933b2913daea
 Stáhnout soubor  Náhled
 Náhled souboru  
  • FR
    • test.blind.cupt2 MB
    • dev-stats.md185 B
    • train-stats.md194 B
    • README.md3 kB
    • dev.cupt3 MB
    • test-stats.md186 B
    • train.cupt26 MB
    • test.cupt2 MB
Icon
Název
HE.tgz
Velikost
5.55 MB
Formát
application/x-gzip
Popis
Hebrew files
MD5
3c9bdcd6ae9372e00f74f90afda741d8
 Stáhnout soubor  Náhled
 Náhled souboru  
  • HE
    • test.blind.cupt5 MB
    • dev-stats.md176 B
    • train-stats.md182 B
    • README.md3 kB
    • dev.cupt5 MB
    • test-stats.md177 B
    • train.cupt18 MB
    • test.cupt5 MB
Icon
Název
HI.tgz
Velikost
626.27 KB
Formát
application/x-gzip
Popis
Hindi files
MD5
9a02e6003be29d13a546b6af053d2baa
 Stáhnout soubor  Náhled
 Náhled souboru  
  • HI
    • test.blind.cupt1 MB
    • train-stats.md172 B
    • README.md1 kB
    • test-stats.md171 B
    • train.cupt1 MB
    • test.cupt1 MB
Icon
Název
HR.tgz
Velikost
1.32 MB
Formát
application/x-gzip
Popis
Croatian files
MD5
f401a6c094e6e1bf48058bef651cd220
 Stáhnout soubor  Náhled
 Náhled souboru  
  • HR
    • test.blind.cupt1 MB
    • dev-stats.md203 B
    • train-stats.md190 B
    • README.md1 kB
    • dev.cupt1 MB
    • test-stats.md186 B
    • train.cupt3 MB
    • test.cupt1 MB
Icon
Název
HU.tgz
Velikost
1.86 MB
Formát
application/x-gzip
Popis
Hungarian files
MD5
a5aa443cc44cdf750af82d1631b12e05
 Stáhnout soubor  Náhled
 Náhled souboru  
  • HU
    • test.blind.cupt1 MB
    • dev-stats.md194 B
    • train-stats.md202 B
    • README.md1 kB
    • dev.cupt1 MB
    • test-stats.md195 B
    • train.cupt9 MB
    • test.cupt1 MB
Icon
Název
IT.tgz
Velikost
4.47 MB
Formát
application/x-gzip
Popis
Italian files
MD5
5927b51aa913c4d0c863dcbbc256e2ce
 Stáhnout soubor  Náhled
 Náhled souboru  
  • IT
    • test.blind.cupt1 MB
    • dev-stats.md251 B
    • train-stats.md244 B
    • README.md4 kB
    • dev.cupt1 MB
    • test-stats.md234 B
    • train.cupt16 MB
    • test.cupt1 MB
Icon
Název
LT.tgz
Velikost
3.44 MB
Formát
application/x-gzip
Popis
Lithuanian files
MD5
39a7a0d6f40d7dfb3eef51b86ed066b4
 Stáhnout soubor  Náhled
 Náhled souboru  
  • LT
    • test.blind.cupt9 MB
    • train-stats.md159 B
    • README.md3 kB
    • test-stats.md159 B
    • train.cupt6 MB
    • test.cupt9 MB
Icon
Název
PL.tgz
Velikost
4.36 MB
Formát
application/x-gzip
Popis
Polish files
MD5
6cfb66bd4176b794ebe5a64c34a342a3
 Stáhnout soubor  Náhled
 Náhled souboru  
  • PL
    • test.blind.cupt2 MB
    • dev-stats.md185 B
    • train-stats.md195 B
    • README.md4 kB
    • dev.cupt2 MB
    • test-stats.md186 B
    • train.cupt20 MB
    • test.cupt2 MB
Icon
Název
PT.tgz
Velikost
7.1 MB
Formát
application/x-gzip
Popis
Portuguese files
MD5
1b9a5b3a3455e8c3fa9ecb4d7a73a944
 Stáhnout soubor  Náhled
 Náhled souboru  
  • PT
    • test.blind.cupt3 MB
    • dev-stats.md170 B
    • train-stats.md178 B
    • README.md3 kB
    • dev.cupt4 MB
    • test-stats.md171 B
    • train.cupt30 MB
    • test.cupt3 MB
Icon
Název
RO.tgz
Velikost
12.14 MB
Formát
application/x-gzip
Popis
Romanian files
MD5
7afa2507293f5251b07057d4cec7fab8
 Stáhnout soubor  Náhled
 Náhled souboru  
  • RO
    • test.blind.cupt8 MB
    • dev-stats.md172 B
    • train-stats.md180 B
    • README.md1 kB
    • dev.cupt8 MB
    • test-stats.md173 B
    • train.cupt57 MB
    • test.cupt8 MB
Icon
Název
SL.tgz
Velikost
3.24 MB
Formát
application/x-gzip
Popis
Slovenian files
MD5
71b95675e197aaa6aa75dcfd07483583
 Stáhnout soubor  Náhled
 Náhled souboru  
  • SL
    • test.blind.cupt1 MB
    • dev-stats.md186 B
    • train-stats.md192 B
    • README.md2 kB
    • dev.cupt1 MB
    • test-stats.md187 B
    • train.cupt8 MB
    • test.cupt1 MB
Icon
Název
TR.tgz
Velikost
4.39 MB
Formát
application/x-gzip
Popis
Turkish files
MD5
88ed39565e0b5cd38f4bc2ff0cced2bd
 Stáhnout soubor  Náhled
 Náhled souboru  
  • TR
    • test.blind.cupt849 kB
    • dev-stats.md137 B
    • train-stats.md157 B
    • README.md3 kB
    • dev.cupt1 MB
    • test-stats.md150 B
    • train.cupt18 MB
    • test.cupt852 kB

Zobrazit minimální záznam