Corpógrafo

A principal actividade do PoloCLUP tem sido a criação do Corpógrafo. Actualmente este ambiente permite que investigadores individuais possam utilizar as várias ferramentas oferecidas através do Corpógrafo bastando para isso ter acesso à Internet. Tem também a alternativa de instalar o Corpógrafo no seu computador. Nesta página pode obter informações sobre a versão instalável do Corpógrafo. Este ambiente permite aos utilizadores:
  • Converter ficheiros nos formatos .pdf, .html, .ps, .doc, rtf,  para formato de texto simples, .txt
  • Organizar os conteúdos de ficheiros em corpora
  • Pesquisar nos corpora utilizando expressões regulares
  • Obter concordâncias e ordená-las de acordo com o contexto à esquerda e à direita
  • Pesquisar nos corpora recorrendo a dicionários do NooJ para inglês, francês e português
  • Criar listas de N-gramas
  • Obter listas de candidatos a termos
  • Criar novas classificações para domínios específicos, relações semânticas e conectores de discurso
  • Alinhar e obter concordâncias em corpora paralelos
  • Visualizar as ocorrências de termos nos corpora
  • Criar e gerir bases de dados terminológicas multilingues
  • Criar e gerir bases de dados lexicais e de fraseologias multilingue
  • Importar e exportar bases de dados
Além disso, através do Corpógrafo ainda é possível:
  • Obter termos (ou itens lexicais) que co-ocorrem nos corpora para facilitar a obtenção de textos similares da internet
  • Associar objectos multimédia a termos
  • Identificar equivalentes de tradução em concordâncias em corpora comparáveis
  • Visualizar redes lexicais constantes numa base de dados
PoloCLUP, o pólo do Porto da Linguateca, funcionou entre Outubro de 2002 e Dezembro de 2008, sob a orientação de Belinda Maia e Diana Santos.