Katalog
Repozitář
Vzdělávání
Projekty
Nástroje
Služby
O nás
Partneři
Prohlášení o poslání
CLARIN
DARIAH
Integrace služeb
Projektové partnerství
Přihlásit se
Domovská stránka repozitáře LINDAT/CLARIAH-CZ
Zobrazit záznam
Show/Hide Menu
Procházet
Vše v repozitáři
Dle data publikování
Autoři
Názvy
Klíčová slova
Vydavatel
Jazyk
Typ
Dle práv
Můj účet
Přihlásit se
Statistiky
Statistiky
BETA
Obecné informace
Nahrát
Cituj
Stavy záznamu
FAQ
O repozitáři
Poradna
Indonesian web corpus
LINDAT / CLARIAH-CZ
Autoři
MEDVEĎ, MAREK
and
Suchomel, Vít
Identifikátor
http://hdl.handle.net/11234/1-2970
Datum vydání
2019-04-02
Typ
corpus
,
text
Velikost
109232712 tokens
Jazyky
Indonesian
Popis
Indonesian web corpus crawled in 2010. Encoded in UTF-8, cleaned, deduplicated, tagged by Morphind.
Nakladatel
Masaryk University, NLP Centre
Klíčová slova
Web corpus
Kolekce
LINDAT / CLARIAH-CZ Data & Tools
Zobrazit celý záznam
Soubory tohoto záznamu
Licenční kategorie:
Academic Use
Licence:
NLP Centre Web Corpus License
Název
indonesianwac3_morphind_lempos.vert.7z
Velikost
207.88 MB
Formát
Neznámý
Popis
vertical text
MD5
f6553682cf576b5868fa8a118d6cbd68
Stáhnout soubor