Katalog
Repozitář
Vzdělávání
Projekty
Nástroje
Služby
O nás
Partneři
Prohlášení o poslání
CLARIN
DARIAH
Integrace služeb
Projektové partnerství
Přihlásit se
Domovská stránka repozitáře LINDAT/CLARIAH-CZ
Zobrazit záznam
Show/Hide Menu
Procházet
Vše v repozitáři
Dle data publikování
Autoři
Názvy
Klíčová slova
Vydavatel
Jazyk
Typ
Dle práv
Můj účet
Přihlásit se
Statistiky
Statistiky
BETA
Obecné informace
Nahrát
Cituj
Stavy záznamu
FAQ
O repozitáři
Poradna
enTenTen
LINDAT / CLARIAH-CZ
Autoři
(:unav) Unknown author
Identifikátor
http://hdl.handle.net/11858/00-097C-0000-0001-CCDF-8
Datum vydání
2011-12-16
Typ
corpus
,
text
Velikost
3268798627 tokens
Jazyky
English
Popis
Very large English web corpus enTenTEn, comprising 3,268,798,627 tokens.
Nakladatel
Masaryk University, NLP Centre
Sponzoři
Lexical Computing Ltd.
Klíčová slova
English large corpus
Kolekce
LINDAT / CLARIAH-CZ Data & Tools
Zobrazit celý záznam
Soubory tohoto záznamu
Licenční kategorie:
Academic Use
Licence:
NLP Centre Web Corpus License
Název
ententen08.vert.gz
Velikost
6.95 GB
Formát
application/x-gzip
MD5
9bf7179d3643f0f42798ef9d75e25ba3
Stáhnout soubor