o corpus do português

o corpus do português


Existem vários recursos que são baseados na versão antiga do Corpus do Português (que foi lançado em 2006), tais como:

O Corpus do Português antigo era bastante pequeno (apenas 20 milhões de palavras para a época de 1900 [século XX] ). Como resultado, criámos diferentes recursos para o Inglês, que não poderiam ser criados para Português até que um corpus muito maior estivesse disponível. Com o nnovo corpus de mil milhão de palavras, podemos agora criar muitos desses recursos. Estes incluem:

  • Dados de texto completos, o que significa que o usuário teria dois mil milhões de palavras ao seu dispor.

  • Dados atualizados, semelhantes à frequência de palavras, colocados, e n-gramas de dados (incluindo os principais 40.000 lemas de Português)

  • WordAndPhrase para o Português, o que lhe permite navegar os 40.000 lemas mais comuns para ver frequência, definição, colocados, concordâncias, e sinónimos - tudo em uma página. Além disso é possível introduzir os seus próprios textos e analisá-los com os dados do corpus.