User Tools

Site Tools


home

This is an old revision of the document!


A PCRE internal error occured. This might be caused by a faulty plugin

===== Título ===== Never Ending Language metaLearning: model management for CMU's ReadTheWeb project. [[https://sigarra.up.pt/feup/pt/estagios_empresas.ver_dados_proposta?p_id=177346&pv_perfil=ALU|Link]] ===== Autor ===== Tiago Miguel Martins Vieira [[http://www.tiagovieira.pt|Link]] ===== Orientadores ===== **Orientador:** Carlos Soares [[https://sigarra.up.pt/feup/pt/func_geral.formview?p_codigo=235847|Link]]\\ **Co-orientador:** Estevam Hruschka Jr. [[http://www2.dc.ufscar.br/~estevam/|Link]]\\ ---- ===== Descrição do Tema ===== ==== Resumo do trabalho ==== O projeto NELL (http://rtw.ml.cmu.edu/rtw/) é reconhecidamente um dos mais interessantes na computação (http://www.nytimes.com/2010/10/05/science/05compute.html?_r=0&adxnnl=1&adxnnlx=1379343724-RNe4yJbCcYJKz4al14jF5Q). O objetivo é o desenvolvimento de um sistema que leia continuamente a web para atualizar o seu conhecimento do mundo. \\ \\ A arquitetura do NELL envolve um grande número de modelos para tarefas diversas, que cobrem desde a recolha dos dados até à atualização do conhecimento e a escolha do conhecimento para validação por humanos. Muitos desses modelos são obtidos com recurso a algoritmos de machine learning e data mining. A utilização de um grande número de algoritmos e modelos cria o desafio de os gerir de forma eficaz e eficiente. Esta gestão é necessária porque um modelo que obtém bons resultados num momento, pode deixar de o fazer noutra altura. Assim, é necessário monitorizar o comportamento dos modelos de forma a identificar o mais rapidamente possível os que não estão a ter um desempenho satisfatório. Quando isso acontece, é então necessário desenvolver novos modelos para o substituirem. Dado que existem muitos algoritmos diferentes para o fazer, é computacionalmente muito pesado testá-los a todos para escolher o melhor modelo, principalmente tendo em conta o volume de dados disponível. Uma abordagem para a tarefa de gestão de modelos é o metalearning. Metalearning consiste na utilização de uma abordagem de machine learning para desenvolver modelos que relacionem as características dos dados usados para obter um modelo com o seu desempenho.\\ \\ Neste projeto pretende-se investigar a aplicabilidade de uma abordagem de metalearning para a gestão dos modelos do NELL. Para isso serão identificados diferentes conjuntos de dados usados para desenvolver modelos usados no NELL; serão aplicados diferentes algoritmos a esses dados e estimado o seu desempenho nas tarefas respetivas; será desenvolvida uma abordagem de metalearning para seleção do melhor algoritmo para cada conjunto de dados; e, em caso de resultados positivos, o sistema desenvolvido será integrado no NELL. ==== Objetivos e Resultados Esperados ==== 1. Estudo comparativo de diferentes algoritmos de machine learning/data mining no NELL \\ 2. Desenvolvimento de uma abordagem de metalearning para a seleção de algoritmos para o NELL \\ 3. Integração da solução de seleção de algoritmos no NELL \\ ==== Aspetos Inovadores ==== Nova abordagem de metalearning para gestão contínua de modelos em problemas de web mining. ==== Plano de Trabalho ==== 1. [mês 1] Pesquisa bibliográfica sobre NELL e metalearning \\ 2. [mês 1] Recolha de dados \\ 3. [mês 2] Concepção da solução de seleção de algoritmos para o NELL baseada em metalearning \\ 4. [mês 3] Implementação da solução \\ 5. [mês 4] Avaliação empírica da solução desenvolvida \\ 6. [mês 5] Integração da solução no NELL \\ 7. [mês 6] Escrita da dissertação \\ ---- ===== Conteúdos ===== - [[estado da arte|Estado da Arte]]

home.1414431262.txt.gz · Last modified: 27/10/2014 18:34 by tvieira