FenixEdu™

Dissertação

{pt_PT=Classification in the Presence of Background Domain Knowledge} {} EVALUATED

Detalhes: {pt=Neste trabalho consideramos o problema de aprender a classificar um grupo de instâncias a partir de um conjunto de treino e de conhecimento de domínio existente. Tradicionalmente, duas abordagens muito diferentes têm dominado a área da classificação, uma baseada em representações lógicas, que faz uso da programação lógica para representar toda a informação conhecida, seja ela observações já classificadas ou conhecimento de domínio disponível; e outra que usa métodos puramente estatísticos e depende apenas de um conjunto de obervações já classificadas para constuir o modelo predictivo. A primeira abordagem lida melhor com com a complexidade do mundo real enquanto a segunda se destaca pela boa capacidade em lidar com a incerteza, tantas vezes presentes nas aplicações práticas. Como tanto a complexidade, como a incerteza, fazem parte do mundo, vemos valor em explorar méto- dos que que consigam lidar melhor com ambas as facetas. Propomos uma abordagem para adicionar conhecimento de domínio, representado numa linguagem de representação de conhecimento standard, para proporcionar às abordagens estatísticas a capacidade de melhor lidar com relações implícitas entre várias dimensões dos dados, que são parte do conhecimento de domínio das várias áreas de aplicação., en=We consider the problem of learning to classify a set of instances based on an available training set and on background domain knowledge. Traditionally, two very different approaches have dominated the area of classification, one based on logic representations that resorts to logic programming to represent the body of what is known, be it observed examples or available domain knowledge, and other that uses purely statistical methods, and only depends on a set of observed examples to build a prediction model. The first approach deals better with the complexity of the real world while the second excels on dealing with the uncertainty that is present in any practical application. As both complexity and uncertainty are part of the real world, we see value in exploring methods that can better deal with both facets. We propose an approach to add domain knowledge, represented in a standard knowledge representation language, to give statistical approaches the ability to better deal with the underlying relations between data that are known to exist in a given domain.}
Keywords: {pt=Classificação, Árvores de decisão, Aspectos semânticos de data mining, Conhecimento de domínio, Ontologias, en=Classification, Decision trees, Semantic aspects of data mining, Background Knowledge, Ontologies}

Discussão: novembro 13, 2014, 11:0