User Tools

Site Tools


home

This is an old revision of the document!


A PCRE internal error occured. This might be caused by a faulty plugin

===== Título ===== Never Ending Language metalearning: model management for CMU's ReadTheWeb project. [[https://sigarra.up.pt/feup/pt/estagios_empresas.ver_dados_proposta?p_id=177346&pv_perfil=ALU|Link]] ===== Autor ===== Tiago Miguel Martins Vieira [[http://www.tiagovieira.pt|Link]] ===== Orientadores ===== **Orientador:** Carlos Soares [[https://sigarra.up.pt/feup/pt/func_geral.formview?p_codigo=235847|Link]]\\ **Co-orientador:** Estevam Hruschka Jr. [[http://www2.dc.ufscar.br/~estevam/|Link]]\\ ---- ===== Descrição do Tema ===== ==== Resumo do trabalho ==== O principal objetivo do projeto ReadTheWeb da CMU é desenvolver um novo tipo de sistema de aprendizagem que lê a web continuamente, 24 horas por dia, 7 dias por semana. Este sistema é chamado de "Never-Ending Language Learner" (NELL). Embora este objetivo não seja necessariamente novo, a NELL destaca-se como sendo capaz de melhorar a forma como aprende ao longo do tempo, o que equivale a dizer que lê a web melhor hoje do que leu no dia anterior. Para ser bem sucedido nesta árdua tarefa, a NELL combina vários componentes de subsistema que implementam métodos de extração de conhecimento complementares. Para uma mesma tarefa, a NELL é capaz de usar diferentes métodos de extração. A performance dos componentes que usam tais métodos, isto é a qualidade do conhecimento extraído para diferentes tópicos, irá variar ao longo do tempo. Por outro lado, a avaliação do conhecimento produzido não é imediata e pode, por vezes, levar dias ou até meses a ser efectuada. De forma a maximizar a performance do sistema como um todo, torna-se necessário, a qualquer momento, conseguir prever quão bom ou mau é o conhecimento produzido. Devido à grande quantidade de informação e algoritmos envolvidos no processo, métodos tradicionais aprendizagem automática não são viáveis. Uma abordagem preliminar usando meta-aprendizagem para combater este problema foi já proposta por Santos. Este projeto propõe-se a estender esse trabalho. A nossa abordagem pretende relacionar as (meta)características dos dados e a sua qualidade. O sistema de meta-aprendizagem proposto neste trabalho é capaz, para diferentes componentes, prever a qualidade da informação proposta para diferentes tópicos. ==== Objetivos e Resultados Esperados ==== 1. Estudo comparativo de diferentes algoritmos de machine learning/data mining no NELL \\ 2. Desenvolvimento de uma abordagem de metalearning para a seleção de algoritmos para o NELL \\ 3. Integração da solução de seleção de algoritmos no NELL \\ ==== Aspetos Inovadores ==== Nova abordagem de metalearning para gestão contínua de modelos em problemas de web mining.

home.1434731511.txt.gz · Last modified: 19/06/2015 17:31 by tvieira