Nově přidané

 corpus 
corpus
Popis:
The Czech translation of SQuAD 2.0 and SQuAD 1.1 datasets contains automatically translated texts, questions and answers from the training set and the development set of the respective datasets. The test set is missing, ...
 Tento záznam obsahuje 1 soubor (19.56 MB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike
 corpus 
corpus
Popis:
CERED (Czech Relationship Dataset) is a family of datasets created via distant supervision on Czech Wikipedia and Wikidata. It was created as part of a thesis on Relationship Extraction (2020). CERED0 is the largest ...
 Tento záznam obsahuje 1 soubor (305.19 MB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike
 corpus 
corpus
Popis:
Data ----- We have collected English-Odia parallel data for the purposes of NLP research of the Odia language. The data for the parallel corpus was extracted from existing parallel corpora such as OdiEnCorp 1.0 and ...
 Tento záznam obsahuje 1 soubor (10.49 MB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike

Nejnavštěvovanější záznamy

Za poslední týden
 corpus 
corpus
Autoři
Zeman, Daniel ; Nivre, Joakim ; Abrams, Mitchell ; Ackermann, Elia ; Aepli, Noëmi ; Agić, Željko ; Ahrenberg, Lars ; Ajede, Chika Kennedy ; Aleksandravičiūtė, Gabrielė ; Antonsen, Lene ; Aplonova, Katya ; Aquino, Angelina ; Aranzabe, Maria Jesus ; Arutie, Gashaw ; Asahara, Masayuki ; Ateyah, Luma ; Atmaca, Furkan ; Attia, Mohammed ; Atutxa, Aitziber ; Augustinus, Liesbeth ; Badmaeva, Elena ; Ballesteros, Miguel ; Banerjee, Esha ; Bank, Sebastian ; Barbu Mititelu, Verginica ; Basmov, Victoria ; Batchelor, Colin ; Bauer, John ; Bengoetxea, Kepa ; Berzak, Yevgeni ; Bhat, Irshad Ahmad ; Bhat, Riyaz Ahmad ; Biagetti, Erica ; Bick, Eckhard ; Bielinskienė, Agnė ; Blokland, Rogier ; Bobicev, Victoria ; Boizou, Loïc ; Borges Völker, Emanuel ; Börstell, Carl ; Bosco, Cristina ; Bouma, Gosse ; Bowman, Sam ; Boyd, Adriane ; Brokaitė, Kristina ; Burchardt, Aljoscha ; Candito, Marie ; Caron, Bernard ; Caron, Gauthier ; Cavalcanti, Tatiana ; Cebiroğlu Eryiğit, Gülşen ; Cecchini, Flavio Massimiliano ; Celano, Giuseppe G. A. ; Čéplö, Slavomír ; Cetin, Savas ; Chalub, Fabricio ; Chi, Ethan ; Choi, Jinho ; Cho, Yongseok ; Chun, Jayeol ; Cignarella, Alessandra T. ; Cinková, Silvie ; Collomb, Aurélie ; Çöltekin, Çağrı ; Connor, Miriam ; Courtin, Marine ; Davidson, Elizabeth ; de Marneffe, Marie-Catherine ; de Paiva, Valeria ; de Souza, Elvis ; Diaz de Ilarraza, Arantza ; Dickerson, Carly ; Dione, Bamba ; Dirix, Peter ; Dobrovoljc, Kaja ; Dozat, Timothy ; Droganova, Kira ; Dwivedi, Puneet ; Eckhoff, Hanne ; Eli, Marhaba ; Elkahky, Ali ; Ephrem, Binyam ; Erina, Olga ; Erjavec, Tomaž ; Etienne, Aline ; Evelyn, Wograine ; Farkas, Richárd ; Fernandez Alcalde, Hector ; Foster, Jennifer ; Freitas, Cláudia ; Fujita, Kazunori ; Gajdošová, Katarína ; Galbraith, Daniel ; Garcia, Marcos ; Gärdenfors, Moa ; Garza, Sebastian ; Gerdes, Kim ; Ginter, Filip ; Goenaga, Iakes ; Gojenola, Koldo ; Gökırmak, Memduh ; Goldberg, Yoav ; Gómez Guinovart, Xavier ; González Saavedra, Berta ; Griciūtė, Bernadeta ; Grioni, Matias ; Grobol, Loïc ; Grūzītis, Normunds ; Guillaume, Bruno ; Guillot-Barbance, Céline ; Güngör, Tunga ; Habash, Nizar ; Hajič, Jan ; Hajič jr., Jan ; Hämäläinen, Mika ; Hà Mỹ, Linh ; Han, Na-Rae ; Harris, Kim ; Haug, Dag ; Heinecke, Johannes ; Hellwig, Oliver ; Hennig, Felix ; Hladká, Barbora ; Hlaváčová, Jaroslava ; Hociung, Florinel ; Hohle, Petter ; Hwang, Jena ; Ikeda, Takumi ; Ion, Radu ; Irimia, Elena ; Ishola, Ọlájídé ; Jelínek, Tomáš ; Johannsen, Anders ; Jónsdóttir, Hildur ; Jørgensen, Fredrik ; Juutinen, Markus ; Kaşıkara, Hüner ; Kaasen, Andre ; Kabaeva, Nadezhda ; Kahane, Sylvain ; Kanayama, Hiroshi ; Kanerva, Jenna ; Katz, Boris ; Kayadelen, Tolga ; Kenney, Jessica ; Kettnerová, Václava ; Kirchner, Jesse ; Klementieva, Elena ; Köhn, Arne ; Köksal, Abdullatif ; Kopacewicz, Kamil ; Korkiakangas, Timo ; Kotsyba, Natalia ; Kovalevskaitė, Jolanta ; Krek, Simon ; Kwak, Sookyoung ; Laippala, Veronika ; Lambertino, Lorenzo ; Lam, Lucia ; Lando, Tatiana ; Larasati, Septina Dian ; Lavrentiev, Alexei ; Lee, John ; Lê Hồng, Phương ; Lenci, Alessandro ; Lertpradit, Saran ; Leung, Herman ; Levina, Maria ; Li, Cheuk Ying ; Li, Josie ; Li, Keying ; Lim, KyungTae ; Li, Yuan ; Ljubešić, Nikola ; Loginova, Olga ; Lyashevskaya, Olga ; Lynn, Teresa ; Macketanz, Vivien ; Makazhanov, Aibek ; Mandl, Michael ; Manning, Christopher ; Manurung, Ruli ; Mărănduc, Cătălina ; Mareček, David ; Marheinecke, Katrin ; Martínez Alonso, Héctor ; Martins, André ; Mašek, Jan ; Matsuda, Hiroshi ; Matsumoto, Yuji ; McDonald, Ryan ; McGuinness, Sarah ; Mendonça, Gustavo ; Miekka, Niko ; Misirpashayeva, Margarita ; Missilä, Anna ; Mititelu, Cătălin ; Mitrofan, Maria ; Miyao, Yusuke ; Montemagni, Simonetta ; More, Amir ; Moreno Romero, Laura ; Mori, Keiko Sophie ; Morioka, Tomohiko ; Mori, Shinsuke ; Moro, Shigeki ; Mortensen, Bjartur ; Moskalevskyi, Bohdan ; Muischnek, Kadri ; Munro, Robert ; Murawaki, Yugo ; Müürisep, Kaili ; Nainwani, Pinkey ; Navarro Horñiacek, Juan Ignacio ; Nedoluzhko, Anna ; Nešpore-Bērzkalne, Gunta ; Nguyễn Thị, Lương ; Nguyễn Thị Minh, Huyền ; Nikaido, Yoshihiro ; Nikolaev, Vitaly ; Nitisaroj, Rattima ; Nurmi, Hanna ; Ojala, Stina ; Ojha, Atul Kr. ; Olúòkun, Adédayọ̀ ; Omura, Mai ; Onwuegbuzia, Emeka ; Osenova, Petya ; Östling, Robert ; Øvrelid, Lilja ; Özateş, Şaziye Betül ; Özgür, Arzucan ; Öztürk Başaran, Balkız ; Partanen, Niko ; Pascual, Elena ; Passarotti, Marco ; Patejuk, Agnieszka ; Paulino-Passos, Guilherme ; Peljak-Łapińska, Angelika ; Peng, Siyao ; Perez, Cenel-Augusto ; Perrier, Guy ; Petrova, Daria ; Petrov, Slav ; Phelan, Jason ; Piitulainen, Jussi ; Pirinen, Tommi A ; Pitler, Emily ; Plank, Barbara ; Poibeau, Thierry ; Ponomareva, Larisa ; Popel, Martin ; Pretkalniņa, Lauma ; Prévost, Sophie ; Prokopidis, Prokopis ; Przepiórkowski, Adam ; Puolakainen, Tiina ; Pyysalo, Sampo ; Qi, Peng ; Rääbis, Andriela ; Rademaker, Alexandre ; Ramasamy, Loganathan ; Rama, Taraka ; Ramisch, Carlos ; Ravishankar, Vinit ; Real, Livy ; Rebeja, Petru ; Reddy, Siva ; Rehm, Georg ; Riabov, Ivan ; Rießler, Michael ; Rimkutė, Erika ; Rinaldi, Larissa ; Rituma, Laura ; Rocha, Luisa ; Romanenko, Mykhailo ; Rosa, Rudolf ; Roșca, Valentin ; Rovati, Davide ; Rudina, Olga ; Rueter, Jack ; Sadde, Shoval ; Sagot, Benoît ; Saleh, Shadi ; Salomoni, Alessio ; Samardžić, Tanja ; Samson, Stephanie ; Sanguinetti, Manuela ; Särg, Dage ; Saulīte, Baiba ; Sawanakunanon, Yanin ; Scarlata, Salvatore ; Schneider, Nathan ; Schuster, Sebastian ; Seddah, Djamé ; Seeker, Wolfgang ; Seraji, Mojgan ; Shen, Mo ; Shimada, Atsuko ; Shirasu, Hiroyuki ; Shohibussirri, Muh ; Sichinava, Dmitry ; Silveira, Aline ; Silveira, Natalia ; Simi, Maria ; Simionescu, Radu ; Simkó, Katalin ; Šimková, Mária ; Simov, Kiril ; Skachedubova, Maria ; Smith, Aaron ; Soares-Bastos, Isabela ; Spadine, Carolyn ; Stella, Antonio ; Straka, Milan ; Strnadová, Jana ; Suhr, Alane ; Sulubacak, Umut ; Suzuki, Shingo ; Szántó, Zsolt ; Taji, Dima ; Takahashi, Yuta ; Tamburini, Fabio ; Tanaka, Takaaki ; Tella, Samson ; Tellier, Isabelle ; Thomas, Guillaume ; Torga, Liisi ; Toska, Marsida ; Trosterud, Trond ; Trukhina, Anna ; Tsarfaty, Reut ; Türk, Utku ; Tyers, Francis ; Uematsu, Sumire ; Untilov, Roman ; Urešová, Zdeňka ; Uria, Larraitz ; Uszkoreit, Hans ; Utka, Andrius ; Vajjala, Sowmya ; van Niekerk, Daniel ; van Noord, Gertjan ; Varga, Viktor ; Villemonte de la Clergerie, Eric ; Vincze, Veronika ; Wakasa, Aya ; Wallin, Lars ; Walsh, Abigail ; Wang, Jing Xian ; Washington, Jonathan North ; Wendt, Maximilan ; Widmer, Paul ; Williams, Seyi ; Wirén, Mats ; Wittern, Christian ; Woldemariam, Tsegay ; Wong, Tak-sum ; Wróblewska, Alina ; Yako, Mary ; Yamashita, Kayo ; Yamazaki, Naoki ; Yan, Chunxiao ; Yasuoka, Koichi ; Yavrumyan, Marat M. ; Yu, Zhuoran ; Žabokrtský, Zdeněk ; Zeldes, Amir ; Zhu, Hanzhi ; Zhuravleva, Anna
Popis:
Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and ...
 Tento záznam obsahuje 3 souborů (432.95 MB).
 
Publicly Available GNU General Public License, version 3.0 Distributed under Creative Commons
 toolService 
toolService
Popis:
Tokenizer, POS Tagger, Lemmatizer and Parser models for 94 treebanks of 61 languages of Universal Depenencies 2.5 Treebanks, created solely using UD 2.5 data (http://hdl.handle.net/11234/1-3105). The model documentation ...
 Tento záznam obsahuje 96 souborů (2.61 GB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike
 corpus 
corpus
Popis:
HindEnCorp parallel texts (sentence-aligned) come from the following sources: Tides, which contains 50K sentence pairs taken mainly from news articles. This dataset was originally col- lected for the DARPA-TIDES ...
 Tento záznam obsahuje 3 souborů (66.13 MB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike