What's New

 corpus 
corpus
Author(s):
Description:
This is the Czech Court Decision Corpus. This corpus contains whole texts of the decisions from three top-tier courts (Supreme, Supreme Administrative and Constitutional court) in Czech republic with the date of decision ...
 This item contains 6 files (1.15 GB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial
 lexicalConceptualResource 
lexicalConceptualResource
Description:
Universal Derivations (UDer) is a collection of harmonized lexical networks capturing word-formation, especially derivational relations, in a cross-linguistically consistent annotation scheme for many languages. The ...
 This item contains 1 file (27.34 MB).
 
Publicly Available Distributed under Creative Commons
 corpus 
corpus
Author(s):
Description:
OAGS is a title generation dataset consisting of 34993700 abstracts and titles from scientific articles. Texts were lowercased and tokenized with Stanford CoreNLP tokenizer. No other preprocessing steps were applied in ...
 This item contains 2 files (14.89 GB).
 
Publicly Available Distributed under Creative Commons Attribution Required

Most Viewed Items

Top Last Week
 corpus 
corpus
Author(s):
Nivre, Joakim ; Abrams, Mitchell ; Agić, Željko ; Ahrenberg, Lars ; Aleksandravičiūtė, Gabrielė ; Antonsen, Lene ; Aplonova, Katya ; Aranzabe, Maria Jesus ; Arutie, Gashaw ; Asahara, Masayuki ; Ateyah, Luma ; Attia, Mohammed ; Atutxa, Aitziber ; Augustinus, Liesbeth ; Badmaeva, Elena ; Ballesteros, Miguel ; Banerjee, Esha ; Bank, Sebastian ; Barbu Mititelu, Verginica ; Basmov, Victoria ; Bauer, John ; Bellato, Sandra ; Bengoetxea, Kepa ; Berzak, Yevgeni ; Bhat, Irshad Ahmad ; Bhat, Riyaz Ahmad ; Biagetti, Erica ; Bick, Eckhard ; Bielinskienė, Agnė ; Blokland, Rogier ; Bobicev, Victoria ; Boizou, Loïc ; Borges Völker, Emanuel ; Börstell, Carl ; Bosco, Cristina ; Bouma, Gosse ; Bowman, Sam ; Boyd, Adriane ; Brokaitė, Kristina ; Burchardt, Aljoscha ; Candito, Marie ; Caron, Bernard ; Caron, Gauthier ; Cebiroğlu Eryiğit, Gülşen ; Cecchini, Flavio Massimiliano ; Celano, Giuseppe G. A. ; Čéplö, Slavomír ; Cetin, Savas ; Chalub, Fabricio ; Choi, Jinho ; Cho, Yongseok ; Chun, Jayeol ; Cinková, Silvie ; Collomb, Aurélie ; Çöltekin, Çağrı ; Connor, Miriam ; Courtin, Marine ; Davidson, Elizabeth ; de Marneffe, Marie-Catherine ; de Paiva, Valeria ; Diaz de Ilarraza, Arantza ; Dickerson, Carly ; Dione, Bamba ; Dirix, Peter ; Dobrovoljc, Kaja ; Dozat, Timothy ; Droganova, Kira ; Dwivedi, Puneet ; Eckhoff, Hanne ; Eli, Marhaba ; Elkahky, Ali ; Ephrem, Binyam ; Erjavec, Tomaž ; Etienne, Aline ; Farkas, Richárd ; Fernandez Alcalde, Hector ; Foster, Jennifer ; Freitas, Cláudia ; Fujita, Kazunori ; Gajdošová, Katarína ; Galbraith, Daniel ; Garcia, Marcos ; Gärdenfors, Moa ; Garza, Sebastian ; Gerdes, Kim ; Ginter, Filip ; Goenaga, Iakes ; Gojenola, Koldo ; Gökırmak, Memduh ; Goldberg, Yoav ; Gómez Guinovart, Xavier ; González Saavedra, Berta ; Grioni, Matias ; Grūzītis, Normunds ; Guillaume, Bruno ; Guillot-Barbance, Céline ; Habash, Nizar ; Hajič, Jan ; Hajič jr., Jan ; Hà Mỹ, Linh ; Han, Na-Rae ; Harris, Kim ; Haug, Dag ; Heinecke, Johannes ; Hennig, Felix ; Hladká, Barbora ; Hlaváčová, Jaroslava ; Hociung, Florinel ; Hohle, Petter ; Hwang, Jena ; Ikeda, Takumi ; Ion, Radu ; Irimia, Elena ; Ishola, Ọlájídé ; Jelínek, Tomáš ; Johannsen, Anders ; Jørgensen, Fredrik ; Kaşıkara, Hüner ; Kaasen, Andre ; Kahane, Sylvain ; Kanayama, Hiroshi ; Kanerva, Jenna ; Katz, Boris ; Kayadelen, Tolga ; Kenney, Jessica ; Kettnerová, Václava ; Kirchner, Jesse ; Köhn, Arne ; Kopacewicz, Kamil ; Kotsyba, Natalia ; Kovalevskaitė, Jolanta ; Krek, Simon ; Kwak, Sookyoung ; Laippala, Veronika ; Lambertino, Lorenzo ; Lam, Lucia ; Lando, Tatiana ; Larasati, Septina Dian ; Lavrentiev, Alexei ; Lee, John ; Lê Hồng, Phương ; Lenci, Alessandro ; Lertpradit, Saran ; Leung, Herman ; Li, Cheuk Ying ; Li, Josie ; Li, Keying ; Lim, KyungTae ; Li, Yuan ; Ljubešić, Nikola ; Loginova, Olga ; Lyashevskaya, Olga ; Lynn, Teresa ; Macketanz, Vivien ; Makazhanov, Aibek ; Mandl, Michael ; Manning, Christopher ; Manurung, Ruli ; Mărănduc, Cătălina ; Mareček, David ; Marheinecke, Katrin ; Martínez Alonso, Héctor ; Martins, André ; Mašek, Jan ; Matsumoto, Yuji ; McDonald, Ryan ; McGuinness, Sarah ; Mendonça, Gustavo ; Miekka, Niko ; Misirpashayeva, Margarita ; Missilä, Anna ; Mititelu, Cătălin ; Miyao, Yusuke ; Montemagni, Simonetta ; More, Amir ; Moreno Romero, Laura ; Mori, Keiko Sophie ; Morioka, Tomohiko ; Mori, Shinsuke ; Moro, Shigeki ; Mortensen, Bjartur ; Moskalevskyi, Bohdan ; Muischnek, Kadri ; Murawaki, Yugo ; Müürisep, Kaili ; Nainwani, Pinkey ; Navarro Horñiacek, Juan Ignacio ; Nedoluzhko, Anna ; Nešpore-Bērzkalne, Gunta ; Nguyễn Thị, Lương ; Nguyễn Thị Minh, Huyền ; Nikaido, Yoshihiro ; Nikolaev, Vitaly ; Nitisaroj, Rattima ; Nurmi, Hanna ; Ojala, Stina ; Olúòkun, Adédayọ̀ ; Omura, Mai ; Osenova, Petya ; Östling, Robert ; Øvrelid, Lilja ; Partanen, Niko ; Pascual, Elena ; Passarotti, Marco ; Patejuk, Agnieszka ; Paulino-Passos, Guilherme ; Peljak-Łapińska, Angelika ; Peng, Siyao ; Perez, Cenel-Augusto ; Perrier, Guy ; Petrova, Daria ; Petrov, Slav ; Piitulainen, Jussi ; Pirinen, Tommi A ; Pitler, Emily ; Plank, Barbara ; Poibeau, Thierry ; Popel, Martin ; Pretkalniņa, Lauma ; Prévost, Sophie ; Prokopidis, Prokopis ; Przepiórkowski, Adam ; Puolakainen, Tiina ; Pyysalo, Sampo ; Rääbis, Andriela ; Rademaker, Alexandre ; Ramasamy, Loganathan ; Rama, Taraka ; Ramisch, Carlos ; Ravishankar, Vinit ; Real, Livy ; Reddy, Siva ; Rehm, Georg ; Rießler, Michael ; Rimkutė, Erika ; Rinaldi, Larissa ; Rituma, Laura ; Rocha, Luisa ; Romanenko, Mykhailo ; Rosa, Rudolf ; Rovati, Davide ; Roșca, Valentin ; Rudina, Olga ; Rueter, Jack ; Sadde, Shoval ; Sagot, Benoît ; Saleh, Shadi ; Salomoni, Alessio ; Samardžić, Tanja ; Samson, Stephanie ; Sanguinetti, Manuela ; Särg, Dage ; Saulīte, Baiba ; Sawanakunanon, Yanin ; Schneider, Nathan ; Schuster, Sebastian ; Seddah, Djamé ; Seeker, Wolfgang ; Seraji, Mojgan ; Shen, Mo ; Shimada, Atsuko ; Shirasu, Hiroyuki ; Shohibussirri, Muh ; Sichinava, Dmitry ; Silveira, Natalia ; Simi, Maria ; Simionescu, Radu ; Simkó, Katalin ; Šimková, Mária ; Simov, Kiril ; Smith, Aaron ; Soares-Bastos, Isabela ; Spadine, Carolyn ; Stella, Antonio ; Straka, Milan ; Strnadová, Jana ; Suhr, Alane ; Sulubacak, Umut ; Suzuki, Shingo ; Szántó, Zsolt ; Taji, Dima ; Takahashi, Yuta ; Tamburini, Fabio ; Tanaka, Takaaki ; Tellier, Isabelle ; Thomas, Guillaume ; Torga, Liisi ; Trosterud, Trond ; Trukhina, Anna ; Tsarfaty, Reut ; Tyers, Francis ; Uematsu, Sumire ; Urešová, Zdeňka ; Uria, Larraitz ; Uszkoreit, Hans ; Vajjala, Sowmya ; van Niekerk, Daniel ; van Noord, Gertjan ; Varga, Viktor ; Villemonte de la Clergerie, Eric ; Vincze, Veronika ; Wallin, Lars ; Walsh, Abigail ; Wang, Jing Xian ; Washington, Jonathan North ; Wendt, Maximilan ; Williams, Seyi ; Wirén, Mats ; Wittern, Christian ; Woldemariam, Tsegay ; Wong, Tak-sum ; Wróblewska, Alina ; Yako, Mary ; Yamazaki, Naoki ; Yan, Chunxiao ; Yasuoka, Koichi ; Yavrumyan, Marat M. ; Yu, Zhuoran ; Žabokrtský, Zdeněk ; Zeldes, Amir ; Zeman, Daniel ; Zhang, Manying ; Zhu, Hanzhi
Description:
Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and ...
 This item contains 3 files (400.69 MB).
 
Publicly Available GNU General Public License, version 3.0 Distributed under Creative Commons
 toolService 
toolService
Description:
Tokenizer, POS Tagger, Lemmatizer and Parser models for 90 treebanks of 60 languages of Universal Depenencies 2.4 Treebanks, created solely using UD 2.4 data (http://hdl.handle.net/11234/1-2988). The model documentation ...
 This item contains 92 files (2.39 GB).
 
Publicly Available Distributed under Creative Commons Attribution Required Noncommercial Share Alike
 corpus 
corpus
Author(s):
Nivre, Joakim ; Agić, Željko ; Ahrenberg, Lars ; Aranzabe, Maria Jesus ; Asahara, Masayuki ; Atutxa, Aitziber ; Ballesteros, Miguel ; Bauer, John ; Bengoetxea, Kepa ; Bhat, Riyaz Ahmad ; Bick, Eckhard ; Bosco, Cristina ; Bouma, Gosse ; Bowman, Sam ; Candito, Marie ; Cebiroğlu Eryiğit, Gülşen ; Celano, Giuseppe G. A. ; Chalub, Fabricio ; Choi, Jinho ; Çöltekin, Çağrı ; Connor, Miriam ; Davidson, Elizabeth ; de Marneffe, Marie-Catherine ; de Paiva, Valeria ; Diaz de Ilarraza, Arantza ; Dobrovoljc, Kaja ; Dozat, Timothy ; Droganova, Kira ; Dwivedi, Puneet ; Eli, Marhaba ; Erjavec, Tomaž ; Farkas, Richárd ; Foster, Jennifer ; Freitas, Cláudia ; Gajdošová, Katarína ; Galbraith, Daniel ; Garcia, Marcos ; Ginter, Filip ; Goenaga, Iakes ; Gojenola, Koldo ; Gökırmak, Memduh ; Goldberg, Yoav ; Gómez Guinovart, Xavier ; Gonzáles Saavedra, Berta ; Grioni, Matias ; Grūzītis, Normunds ; Guillaume, Bruno ; Habash, Nizar ; Hajič, Jan ; Hà Mỹ, Linh ; Haug, Dag ; Hladká, Barbora ; Hohle, Petter ; Ion, Radu ; Irimia, Elena ; Johannsen, Anders ; Jørgensen, Fredrik ; Kaşıkara, Hüner ; Kanayama, Hiroshi ; Kanerva, Jenna ; Kotsyba, Natalia ; Krek, Simon ; Laippala, Veronika ; Lê Hồng, Phương ; Lenci, Alessandro ; Ljubešić, Nikola ; Lyashevskaya, Olga ; Lynn, Teresa ; Makazhanov, Aibek ; Manning, Christopher ; Mărănduc, Cătălina ; Mareček, David ; Martínez Alonso, Héctor ; Martins, André ; Mašek, Jan ; Matsumoto, Yuji ; McDonald, Ryan ; Missilä, Anna ; Mititelu, Verginica ; Miyao, Yusuke ; Montemagni, Simonetta ; More, Amir ; Mori, Shunsuke ; Moskalevskyi, Bohdan ; Muischnek, Kadri ; Mustafina, Nina ; Müürisep, Kaili ; Nguyễn Thị, Lương ; Nguyễn Thị Minh, Huyền ; Nikolaev, Vitaly ; Nurmi, Hanna ; Ojala, Stina ; Osenova, Petya ; Øvrelid, Lilja ; Pascual, Elena ; Passarotti, Marco ; Perez, Cenel-Augusto ; Perrier, Guy ; Petrov, Slav ; Piitulainen, Jussi ; Plank, Barbara ; Popel, Martin ; Pretkalniņa, Lauma ; Prokopidis, Prokopis ; Puolakainen, Tiina ; Pyysalo, Sampo ; Rademaker, Alexandre ; Ramasamy, Loganathan ; Real, Livy ; Rituma, Laura ; Rosa, Rudolf ; Saleh, Shadi ; Sanguinetti, Manuela ; Saulīte, Baiba ; Schuster, Sebastian ; Seddah, Djamé ; Seeker, Wolfgang ; Seraji, Mojgan ; Shakurova, Lena ; Shen, Mo ; Sichinava, Dmitry ; Silveira, Natalia ; Simi, Maria ; Simionescu, Radu ; Simkó, Katalin ; Šimková, Mária ; Simov, Kiril ; Smith, Aaron ; Suhr, Alane ; Sulubacak, Umut ; Szántó, Zsolt ; Taji, Dima ; Tanaka, Takaaki ; Tsarfaty, Reut ; Tyers, Francis ; Uematsu, Sumire ; Uria, Larraitz ; van Noord, Gertjan ; Varga, Viktor ; Vincze, Veronika ; Washington, Jonathan North ; Žabokrtský, Zdeněk ; Zeldes, Amir ; Zeman, Daniel ; Zhu, Hanzhi
Description:
Universal Dependencies is a project that seeks to develop cross-linguistically consistent treebank annotation for many languages, with the goal of facilitating multilingual parser development, cross-lingual learning, and ...
 This item contains 4 files (399.22 MB).
 
Publicly Available GNU General Public License, version 3.0 Distributed under Creative Commons