Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Changes in version 1.1:
1. Universal Dependencies tagset instead of the older and smaller Google Universal POS tagset.
2. SVM classifier trained on Universal Dependencies 1.2 instead of HamleDT 2.0.
3. Balto-Slavic languages, Germanic languages and Romance languages were tagged by classifier trained only on the respective group of languages. Other languages were tagged by a classifier trained on all available languages. The "c7" combination from version 1.0 is no longer used.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Jan Patočka
Publisher:
Příloha II, str. 285–299. Náčrt.
Type:
Text
Subject:
1972/3 , 1977/31 , 1979 , 1983/34 , 1988/4 , 1991/6 , 1997/5 , 1999/6 , cs , es , fr , Předn. cykl. , and SS-2/PD-II
Language:
Czech , French , and Spanish
Rights:
open access and Rights holder: Archiv Jana Patočky, z.s.
Creator:
Jan Patočka
Publisher:
Příloha II, str. 285–299. Náčrt. — 2. otisk in: Péče o duši II (SS-2/PD-II), Praha 1999, str. 356–369 (v. 1999/6). — Srv. 1972/3, 1977/31 a 1988/4.
Type:
Text and fr,es,cs
Subject:
1972/3 , 1977/31 , 1979 , 1983/34 , 1988/4 , 1991/6 , 1997/5 , 1999/6 , cs , es , fr , Náčrt , and SS-2/PD-II
Language:
French , Spanish , and Czech
Rights:
open access and Rights holder: Archiv Jana Patočky, z.s.
Publisher:
Universitat de Barcelona
Type:
languageDescription
Subject:
dependency grammar
Language:
Catalan , English , and Spanish
Description:
Dependency grammars
Rights:
Not specified
Creator:
Jan Patočka
Publisher:
Sborník prací filosofické fakulty brněnské university 19–20 (1971), Řada uměnovědná (F), č. 14–15, str. 11–26. Stať. něm.
Type:
Text
Subject:
1970/6 , 1971 , 1988/30 , 1991/2 , 2004/10 , 2009/1 , cs , es , fr , pt , SS-7/Fen-II , and Stať. něm.
Language:
Czech , French , Portuguese , and Spanish
Rights:
open access and Rights holder: Archiv Jana Patočky, z.s.
Creator:
Jan Patočka
Publisher:
Philosophische Perspektiven, ein Jahrbuch, sv. 2, ed. R. Berlinger a E. Fink, Frankfurt/M. (v. Klostermann) 1970, str. 317–334. Stať. něm.
Type:
Text
Subject:
1970 , 1988/30 , 1991/2 , 2004/10 , 2009/1 , cn , cs , de , es , fr , hu , pt , SS-7/Fen-II , and Stať. něm.
Language:
German , Czech , French , Hungarian , Portuguese , and Spanish
Rights:
open access and Rights holder: Archiv Jana Patočky, z.s.
Creator:
Stavenhagen, Rodolfo,
Publisher:
El Colegio de México,
Subject:
indiáni , světové dějiny od r. 1918 do současnosti , and národnosti, vztahy mezi národnostmi a národní hnutí
Language:
Spanish
Rights:
unknown
Creator:
Stavenhagen, Rodolfo,
Type:
text and monografie kolektivní
Subject:
Dějiny Severní a Střední Ameriky , indiáni , národnosti, vztahy mezi národnostmi a národní hnutí , and světové dějiny od r. 1918 do současnosti
Language:
Spanish
Rights:
unknown
Creator:
Polišenský, Josef,
Type:
text and monografie
Subject:
Dějiny zemí střední Evropy , politika , dějiny společnosti , politické dějiny, politici , přehledná zpracování světových dějin (chronologicky) , and společenská struktura
Language:
Spanish
Rights:
unknown
Creator:
Lucien, Renée Clémentine,
Type:
text and studie
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , Dějiny Střední Ameriky a Karibské oblasti , Guimarães, Marilia , režimy autoritativní , opozice politická , revolucionáři , perzekuce , cesty zahraniční , vzpomínky , Brazílie , Kuba , světové dějiny od r. 1945 do současnosti , politické dějiny, politici , and literatura, spisovatelé
Language:
Spanish
Rights:
unknown