TweeProfiles: Detecção de padrões espácio-temporais no Twitter

Dados privados

  • Nome do autor: Tiago Daniel Sá Cunha
  • Orientador: Carlos Soares (PhD)
  • Co-orientadora: Eduarda Mendes Rodrigues (PhD)
  • Trabalho desenvolvido no laboratório SAPO-FEUP

Resumo

  • Redes sociais na internet apresentam-se como fontes de informação valiosas, no que diz respeito aos seus utilizadores e aos seus respectivos interesses. Tal informação tem sido sujeita a vários estudos, conduzidos por investigadores de Data Mining de todo o Mundo, de forma a descobrir comportamentos e padrões dos utilizadores. Para além disso, tem existido também investimento em criar plataformas para extracção contínua e visualização de informação.
  • Esta dissertação espera identificar perfis de tweets envolvendo multiplos tipos de informação: espacial, temporal, social e de conteúdo. Os objectivos estabelecidos são para o desenvolvimento de uma metodologia de data mining que valide a combinação dimensional e a criação de uma ferramenta de visualização para representar os resultados obtidos recorrendo a representações encontradas no estado da Arte.
  • O processo de data mining é composto pela computação, normalização e combinação de matrizes de dissemelhança. Cada matriz de dissemelhança é submetida a um algoritmo de clustering que realiza a extracção do conhecimento. Esta dissertação estuda em profundidade várias funções de distância para diferentes tipos de dados, os métodos de combinação e normalização disponíveis e os algoritmos de clustering existentes.
  • A ferramenta de visualização está desenhada para uma utilização dinâmica e intuitiva, direccionada para a representação de padrões no processo de Data Mining de uma forma compreensível e interactiva. Para atingir estes objectivos, vários padrões de visualização foram estudados, assim como vários widgets capazes de representar os padrões obtidos.
  • O caso de estudo em que esta dissertação será aplicada são os dados georeferenciados do TwitterEcho, apesar de ser desenvolvida para suportar quaisquer tweets georeferenciados provenientes do Twitter.

Website do produto final