Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution 4.0 International (CC BY 4.0) , http://creativecommons.org/licenses/by/4.0/ , and PUB
Creator:
Murnu, George,
Type:
text and studie
Subject:
Dějiny států a území na Balkánském poloostrově , Rumuni , osídlení rumunské , kolonizace rumunská , Rumunsko , dějiny společnosti , světové dějiny středověku (do r. 1492) , and Evropa za hranicemi antického světa
Language:
Romanian
Rights:
unknown
Creator:
Karel
Type:
text , prameny , and překlady
Subject:
Biografie , Karel , Václav, , panovníci čeští , panovníci římsko-němečtí , autobiografie , legendy svatojánské , české země 1306-1419 , and literatura, spisovatelé
Language:
Romanian
Description:
Viaţa lui Carol al IV-lea and Legenda Sfântului Venceslav
Rights:
unknown
Creator:
Dan, Mihail P.,
Type:
text and monografie
Subject:
Demografie. Populace , vztahy rumunsko-české , vztahy rumunsko-slovenské , české země 1306-1526 , zahraniční politika, mezinárodní vztahy , Rumunsko , světové dějiny středověku (do r. 1492) , and české země od příchodu Slovanů do roku 1306
Language:
Romanian
Rights:
unknown
Creator:
Dan, Mihail P.,
Type:
text and monografie
Subject:
Mezinárodní vztahy, světová politika , vztahy česko-rumunské , vztahy slovensko-rumunské , vztahy mezinárodní , vztahy kulturní , zahraniční politika, mezinárodní vztahy , světové dějiny středověku (do r. 1492) , Rumunsko , and české země 1306-1526
Language:
Romanian
Rights:
unknown
Creator:
Legrand, Veronica
Publisher:
Editura Ivan Krasko,
Subject:
dějiny států , Češi rumunští , politické dějiny, politici , světové dějiny od r. 1918 do současnosti , Rumunsko , národnosti, vztahy mezi národnostmi a národní hnutí , migrace, vystěhovalectví, kolonizace , and Československo 1918-1992
Language:
Romanian
Rights:
unknown
Creator:
Diaconu, Gheorghe,
Type:
text and monografie
Subject:
Archeologie , archeologie středověku , hrady , Rumunsko , hrady, hradiště, zámky, tvrze, dvory , světové dějiny středověku (do r. 1492) , and archeologické výzkumy, archeologie v muzeích a archivech
Language:
Romanian
Rights:
unknown
Creator:
Ekrem, Mehmet Ali
Type:
text and monografie
Subject:
Dějiny států západní Asie. Blízký východ , Turci , dějiny turecké , Turecko , přehledná zpracování světových dějin (chronologicky) , přehledná zpracování (tematicky) , and Osmanská říše
Language:
Romanian
Rights:
unknown
Creator:
Vasile, Cristian
Subject:
konference mezinárodní , Pražské jaro (1968) , dějiny politické , Mnichov 1938, Pražské jaro 1968, okupace 1939, 1968 , světové dějiny od r. 1945 do současnosti , zahraniční konference, kongresy , and Československo 1948-1969
Language:
Romanian
Description:
[Washington D.C., 6.-7.11.2008]
Rights:
unknown
Creator:
Zeman, Daniel and Straka, Milan
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
tokenization , word segmentation , morphology , tagging , syntax , parsing , and universal dependencies
Language:
Afrikaans , Arabic , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Persian , Finnish , French , Old French (842-ca. 1400) , Irish , Galician , Gothic , Ancient Greek (to 1453) , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Latin , Latvian , Dutch , Norwegian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Thai , Turkish , Uighur , Ukrainian , Urdu , Vietnamese , and Chinese
Description:
CoNLL 2017 and 2018 shared tasks:
Multilingual Parsing from Raw Text to Universal Dependencies
This package contains the test data in the form in which they ware presented
to the participating systems: raw text files and files preprocessed by UDPipe.
The metadata.json files contain lists of files to process and to output;
README files in the respective folders describe the syntax of metadata.json.
For full training, development and gold standard test data, see
Universal Dependencies 2.0 (CoNLL 2017)
Universal Dependencies 2.2 (CoNLL 2018)
See the download links at http://universaldependencies.org/.
For more information on the shared tasks, see
http://universaldependencies.org/conll17/
http://universaldependencies.org/conll18/
Contents:
conll17-ud-test-2017-05-09 ... CoNLL 2017 test data
conll18-ud-test-2018-05-06 ... CoNLL 2018 test data
conll18-ud-test-2018-05-06-for-conll17 ... CoNLL 2018 test data with metadata
and filenames modified so that it is digestible by the 2017 systems.
Rights:
Licence Universal Dependencies v2.2 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.2 , and PUB