Nově přidané

 corpus 
corpus
Popis:
Automatically generated spelling correction corpus for Czech (Czesl-SEC-AG) is a corpus containg text with automatically generated spelling errors. To create spelling errors, a character error model containing probabilities ...
 Tento záznam obsahuje 1 soubor (10.4 MB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike
 corpus 
corpus
Popis:
CzeSL-GEC is a corpus containing sentence pairs of original and corrected versions of Czech sentences collected from essays written by both native Czech pupils and pupils with Romani background. To create this corpus, ...
 Tento záznam obsahuje 1 soubor (5.08 MB).
 
Publicly Available Distributed under Creative Commons Attribution Required Share Alike
 corpus 
corpus
Popis:
Test data for the WMT17 QE task. Train data can be downloaded from http://hdl.handle.net/11372/LRT-1974 This shared task will build on its previous five editions to further examine automatic methods for estimating the ...
 Tento záznam obsahuje 7 souborů (9.11 MB).
 
Publicly Available

Nejnavštěvovanější záznamy

Za poslední týden
 corpus 
corpus
Autoři
Nivre, Joakim ; Agić, Željko ; Ahrenberg, Lars ; Aranzabe, Maria Jesus ; Asahara, Masayuki ; Atutxa, Aitziber ; Ballesteros, Miguel ; Bauer, John ; Bengoetxea, Kepa ; Bhat, Riyaz Ahmad ; Bick, Eckhard ; Bosco, Cristina ; Bouma, Gosse ; Bowman, Sam ; Candito, Marie ; Cebiroğlu Eryiğit, Gülşen ; Celano, Giuseppe G. A. ; Chalub, Fabricio ; Choi, Jinho ; Çöltekin, Çağrı ; Connor, Miriam ; Davidson, Elizabeth ; de Marneffe, Marie-Catherine ; de Paiva, Valeria ; Diaz de Ilarraza, Arantza ; Dobrovoljc, Kaja ; Dozat, Timothy ; Droganova, Kira ; Dwivedi, Puneet ; Eli, Marhaba ; Erjavec, Tomaž ; Farkas, Richárd ; Foster, Jennifer ; Freitas, Cláudia ; Gajdošová, Katarína ; Galbraith, Daniel ; Garcia, Marcos ; Ginter, Filip ; Goenaga, Iakes ; Gojenola, Koldo ; Gökırmak, Memduh ; Goldberg, Yoav ; Gómez Guinovart, Xavier ; Gonzáles Saavedra, Berta ; Grioni, Matias ; Grūzītis, Normunds ; Guillaume, Bruno ; Habash, Nizar ; Hajič, Jan ; Hà Mỹ, Linh ; Haug, Dag ; Hladká, Barbora ; Hohle, Petter ; Ion, Radu ; Irimia, Elena ; Johannsen, Anders ; Jørgensen, Fredrik ; Kaşıkara, Hüner ; Kanayama, Hiroshi ; Kanerva, Jenna ; Kotsyba, Natalia ; Krek, Simon ; Laippala, Veronika ; Lê Hồng, Phương ; Lenci, Alessandro ; Ljubešić, Nikola ; Lyashevskaya, Olga ; Lynn, Teresa ; Makazhanov, Aibek ; Manning, Christopher ; Mărănduc, Cătălina ; Mareček, David ; Martínez Alonso, Héctor ; Martins, André ; Mašek, Jan ; Matsumoto, Yuji ; McDonald, Ryan ; Missilä, Anna ; Mititelu, Verginica ; Miyao, Yusuke ; Montemagni, Simonetta ; More, Amir ; Mori, Shunsuke ; Moskalevskyi, Bohdan ; Muischnek, Kadri ; Mustafina, Nina ; Müürisep, Kaili ; Nguyễn Thị, Lương ; Nguyễn Thị Minh, Huyền ; Nikolaev, Vitaly ; Nurmi, Hanna ; Ojala, Stina ; Osenova, Petya ; Øvrelid, Lilja ; Pascual, Elena ; Passarotti, Marco ; Perez, Cenel-Augusto ; Perrier, Guy ; Petrov, Slav ; Piitulainen, Jussi ; Plank, Barbara ; Popel, Martin ; Pretkalniņa, Lauma ; Prokopidis, Prokopis ; Puolakainen, Tiina ; Pyysalo, Sampo ; Rademaker, Alexandre ; Ramasamy, Loganathan ; Real, Livy ; Rituma, Laura ; Rosa, Rudolf ; Saleh, Shadi ; Sanguinetti, Manuela ; Saulīte, Baiba ; Schuster, Sebastian ; Seddah, Djamé ; Seeker, Wolfgang ; Seraji, Mojgan ; Shakurova, Lena ; Shen, Mo ; Sichinava, Dmitry ; Silveira, Natalia ; Simi, Maria ; Simionescu, Radu ; Simkó, Katalin ; Šimková, Mária ; Simov, Kiril ; Smith, Aaron ; Suhr, Alane ; Sulubacak, Umut ; Szántó, Zsolt ; Taji, Dima ; Tanaka, Takaaki ; Tsarfaty, Reut ; Tyers, Francis ; Uematsu, Sumire ; Uria, Larraitz ; van Noord, Gertjan ; Varga, Viktor ; Vincze, Veronika ; Washington, Jonathan North ; Žabokrtský, Zdeněk ; Zeldes, Amir ; Zeman, Daniel ; Zhu, Hanzhi
Popis:
Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and ...
 Tento záznam obsahuje 4 souborů (399.22 MB).
 
Publicly Available GNU General Public License, version 3.0 Distributed under Creative Commons
 languageDescription 
languageDescription
Popis:
Automatic segmentation, tokenization and morphological and syntactic annotations of raw texts in 45 languages, generated by UDPipe (http://ufal.mff.cuni.cz/udpipe), together with word embeddings of dimension 100 computed ...
 Tento záznam obsahuje 46 souborů (629.66 GB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike
 corpus 
corpus
Autoři
Nivre, Joakim ; Agić, Željko ; Ahrenberg, Lars ; Aranzabe, Maria Jesus ; Asahara, Masayuki ; Atutxa, Aitziber ; Ballesteros, Miguel ; Bauer, John ; Bengoetxea, Kepa ; Bhat, Riyaz Ahmad ; Bick, Eckhard ; Bosco, Cristina ; Bouma, Gosse ; Bowman, Sam ; Candito, Marie ; Cebiroğlu Eryiğit, Gülşen ; Celano, Giuseppe G. A. ; Chalub, Fabricio ; Choi, Jinho ; Çöltekin, Çağrı ; Connor, Miriam ; Davidson, Elizabeth ; de Marneffe, Marie-Catherine ; de Paiva, Valeria ; Diaz de Ilarraza, Arantza ; Dobrovoljc, Kaja ; Dozat, Timothy ; Droganova, Kira ; Dwivedi, Puneet ; Eli, Marhaba ; Erjavec, Tomaž ; Farkas, Richárd ; Foster, Jennifer ; Freitas, Cláudia ; Gajdošová, Katarína ; Galbraith, Daniel ; Garcia, Marcos ; Ginter, Filip ; Goenaga, Iakes ; Gojenola, Koldo ; Gökırmak, Memduh ; Goldberg, Yoav ; Gómez Guinovart, Xavier ; Gonzáles Saavedra, Berta ; Grioni, Matias ; Grūzītis, Normunds ; Guillaume, Bruno ; Habash, Nizar ; Hajič, Jan ; Hà Mỹ, Linh ; Haug, Dag ; Hladká, Barbora ; Hohle, Petter ; Ion, Radu ; Irimia, Elena ; Johannsen, Anders ; Jørgensen, Fredrik ; Kaşıkara, Hüner ; Kanayama, Hiroshi ; Kanerva, Jenna ; Kotsyba, Natalia ; Krek, Simon ; Laippala, Veronika ; Lê Hồng, Phương ; Lenci, Alessandro ; Ljubešić, Nikola ; Lyashevskaya, Olga ; Lynn, Teresa ; Makazhanov, Aibek ; Manning, Christopher ; Mărănduc, Cătălina ; Mareček, David ; Martínez Alonso, Héctor ; Martins, André ; Mašek, Jan ; Matsumoto, Yuji ; McDonald, Ryan ; Missilä, Anna ; Mititelu, Verginica ; Miyao, Yusuke ; Montemagni, Simonetta ; More, Amir ; Mori, Shunsuke ; Moskalevskyi, Bohdan ; Muischnek, Kadri ; Mustafina, Nina ; Müürisep, Kaili ; Nguyễn Thị, Lương ; Nguyễn Thị Minh, Huyền ; Nikolaev, Vitaly ; Nurmi, Hanna ; Ojala, Stina ; Osenova, Petya ; Øvrelid, Lilja ; Pascual, Elena ; Passarotti, Marco ; Perez, Cenel-Augusto ; Perrier, Guy ; Petrov, Slav ; Piitulainen, Jussi ; Plank, Barbara ; Popel, Martin ; Pretkalniņa, Lauma ; Prokopidis, Prokopis ; Puolakainen, Tiina ; Pyysalo, Sampo ; Rademaker, Alexandre ; Ramasamy, Loganathan ; Real, Livy ; Rituma, Laura ; Rosa, Rudolf ; Saleh, Shadi ; Sanguinetti, Manuela ; Saulīte, Baiba ; Schuster, Sebastian ; Seddah, Djamé ; Seeker, Wolfgang ; Seraji, Mojgan ; Shakurova, Lena ; Shen, Mo ; Sichinava, Dmitry ; Silveira, Natalia ; Simi, Maria ; Simionescu, Radu ; Simkó, Katalin ; Šimková, Mária ; Simov, Kiril ; Smith, Aaron ; Suhr, Alane ; Sulubacak, Umut ; Szántó, Zsolt ; Taji, Dima ; Tanaka, Takaaki ; Tsarfaty, Reut ; Tyers, Francis ; Uematsu, Sumire ; Uria, Larraitz ; van Noord, Gertjan ; Varga, Viktor ; Vincze, Veronika ; Washington, Jonathan North ; Žabokrtský, Zdeněk ; Zeldes, Amir ; Zeman, Daniel ; Zhu, Hanzhi
Popis:
This release contains errors in several files. Please use http://hdl.handle.net/11234/1-1983 instead.
 Tento záznam obsahuje 4 souborů (399.22 MB).
 
Publicly Available GNU General Public License, version 3.0 Distributed under Creative Commons