o corpus do português


Os corpora
Tamanho dos corpus
Comparar
Recursos
Problemas (inglês)
Contatar



Existem vários recursos que são baseados na versão antiga do Corpus do Português (que foi lançado em 2006), tais como:

O Corpus do Português antigo era bastante pequeno (apenas 20 milhões de palavras para a época de 1900 [século XX] ). Como resultado, criámos diferentes recursos para o Inglês, que não poderiam ser criados para Português até que um corpus muito maior estivesse disponível. Com o nnovo corpus de mil milhão de palavras, podemos agora criar muitos desses recursos. Estes incluem:

  • Dados de texto completos, o que significa que o usuário teria dois mil milhões de palavras ao seu dispor.

  • Dados atualizados, semelhantes à frequência de palavras, colocados, e n-gramas de dados (incluindo os principais 40.000 lemas de Português)

  • WordAndPhrase para o Português, o que lhe permite navegar os 40.000 lemas mais comuns para ver frequência, definição, colocados, concordâncias, e sinónimos - tudo em uma página. Além disso é possível introduzir os seus próprios textos e analisá-los com os dados do corpus.