Existem vários
recursos que são baseados na versão antiga do Corpus do
Português (que foi lançado em 2006), tais como:
O Corpus do Português antigo era bastante pequeno (apenas
20 milhões de palavras para a época de 1900 [século XX] ). Como resultado,
criámos diferentes recursos para o Inglês, que não poderiam ser criados para
Português até que um corpus muito maior estivesse disponível. Com o nnovo corpus de mil milhão de palavras,
podemos agora criar muitos desses recursos. Estes incluem:
-
Dados de
texto completos, o que
significa que o usuário teria dois mil milhões de palavras ao seu dispor.
-
Dados
atualizados, semelhantes à
frequência de palavras, colocados,
e n-gramas
de dados (incluindo os principais 40.000 lemas de Português)
-
WordAndPhrase para o Português,
o que lhe permite navegar os 40.000 lemas mais comuns para ver frequência,
definição, colocados, concordâncias, e sinónimos - tudo em uma página. Além
disso é possível introduzir os seus próprios textos e analisá-los com
os dados do corpus.
|
|