Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Changes in version 1.1:
1. Universal Dependencies tagset instead of the older and smaller Google Universal POS tagset.
2. SVM classifier trained on Universal Dependencies 1.2 instead of HamleDT 2.0.
3. Balto-Slavic languages, Germanic languages and Romance languages were tagged by classifier trained only on the respective group of languages. Other languages were tagged by a classifier trained on all available languages. The "c7" combination from version 1.0 is no longer used.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Josef Beneš
Publisher:
Česká akademie věd a umění
Format:
print and xiv, 327 s.
Type:
text , volume , studie , model:monograph , and TEXT
Subject:
Moderní západní filozofie , Descartes, René , 1596-1650 , filozofové , filozofické myšlení , filozofie vědy , vědecká metodologie , francouzská filozofie , 101-051 , 14(44) , 001.11 , (049) , 5 , and 14(100-15)"15/20"
Language:
Czech , Latin , and French
Description:
napsal Josef Beneš., KČSN, Obsahuje bibliografii, and Část. latinský a francouzský text
Rights:
http://creativecommons.org/licenses/by-nc-sa/4.0/ and policy:public
Type:
text , prameny , and edice
Subject:
Dějiny Česka a Slovenska , dějiny české , and pomocné vědy historické
Language:
Czech and Latin
Description:
Vydává Historický ústav v Praze
Rights:
unknown
Publisher:
Jan Karel Hraba, Gegjch Milostj P.P. Stawu Ympressor
Type:
model:monograph and TEXT
Language:
Czech and Latin
Rights:
http://creativecommons.org/publicdomain/mark/1.0/ and policy:public
Type:
text and kroniky
Subject:
Dějiny Česka a Slovenska , Literární kritika, věcná literatura a různé další žánry , Dalimil, , kroniky středověké , edice , překlady , české země 1306-1419 , and dějepisectví, historické vědy, historici
Language:
Czech , German , and Latin
Description:
Přeloženo ze staročeštiny and 270 výt.
Rights:
unknown
Creator:
Paprocký z Hlohol a Paprocké Vůle, Bartoloměj,
Type:
text and tisky staré
Subject:
Staré tisky , panovníci , šlechtici , měšťanstvo , hodnostáři církevní , dějiny české , české země 1526-1620 , and dějiny společnosti
Language:
Czech and Latin
Description:
Výzdoba: Iniciály, vlysy z typografických ozdob, viněty, dřevořezové ilustrace v textu (portréty českých knížat a králů, portréty a erby české šlechty, městské znaky)
Rights:
unknown
Creator:
Srnec z Varvažova, Jakub , Černý z Černého Mostu, Jiří , Bezdružický z Kolovrat, Jan , Kinský ze Vchynic, Jan , Codicillus z Tulechova, Petr , Mitis z Limuz, Tomáš , Proxenus ze Sudetu, Šimon , and Rosacius, Jan
Publisher:
Černý z Černého Mostu, Jiří
Format:
print and [38], 224, [2] pp ; 8°
Type:
model:monograph and TEXT
Subject:
století 16. and etická výchova
Language:
Latin and Czech
Description:
K15642 and Rukopisné přípisky na předním přídeští, na titulní straně, řídce v textu.
Rights:
http://creativecommons.org/publicdomain/mark/1.0/ and policy:public
Creator:
Rychterová, Pavlína,
Publisher:
Böhlau,
Type:
monografie
Subject:
Křesťanská teologie. Dogmatická teologie , Štítný ze Štítného, Tomáš, , Brigita, , literatura církevní , světci , překlady , jazyk český , rukopisy , světové dějiny středověku (do r. 1492) , církevní a náboženské dějiny , české země 1306-1419 , and jednotlivci (církevní dějiny)
Language:
German , Czech , and Latin
Description:
Přeloženo z latiny
Rights:
unknown
Creator:
Rychterová, Pavlína,
Type:
text and monografie
Subject:
Křesťanská teologie. Dogmatická teologie , Brigita, , Štítný ze Štítného, Tomáš, , literatura církevní , světci , překlady , jazyk český , rukopisy , jednotlivci (církevní dějiny) , světové dějiny středověku (do r. 1492) , církevní a náboženské dějiny , and české země 1306-1419
Language:
German , Czech , and Latin
Rights:
unknown