Propostas
1 - Learning to rank for keyword extraction | |||||||||
A ideia deste trabalho é usar uma biblioteca de learning to rank, tal como o RankLib (http://www.cs.umass.edu/~vdang/ranklib.html), numa tarefa de extracção de palavras chave desde documentos (a biblioteca pode ser usada para combinar diferentes estimadores de relevância para os termos). O trabalho irá envolver as seguintes etapas: | |||||||||
* Fazer um extractor de termos chave desde documentos de texto (e.g., extrair as palavras individuais e os termos compostos de n-palavras).* Calcular uma série de características sobre os termos (e.g., frequência nodocumento, frequência na Web, estar em maiúsculas, etc.) * Usar a biblioteca de learning to rank para combinar as caractesrísticas, eordenar os termos extraídos pela sua relevância.* Avaliar os resultados com uma colecção existente, tal como a do SemEval 2010 (http://semeval2.fbk.eu/semeval2.php?location=tasks#T6)
|