Proposta de dissertação do MEI
Título: *** Detecção com word2vec de concerns em bases de código
Proponente(s): Miguel Pessoa Monteiro (DI/FCT/UNL)
Nuno Cavalheiro Marques (DI/FCT/UNL)
Créditos: 42 ECTS
Área científica: Decision Support and Artificial Intelligence
Início preferencial: Qualquer semestre
URL:
Já estão em curso trabalhos preliminares executados pelo alunos:
Bruno Palma trabalhou nesta frente. Bruno Jota está a continuá-lo no contexto da sua tese
Breve descrição: Projecto consiste em investigar uma técnica para a detecção automática de concerns (conceitos ou abstracções enquanto módulos latentes) em bases de código de linguagens voltadas para a análise de dados (e.g., R, Python, MATLAB). Neste projecto, serão repositórios MATLAB de grandes dimensões.
A técnica consiste na extracção de dados de repositórios MATLAB (já existe uma ferramenta Java, que poderá requerer extensões) e subsequente computação de métricas baseadas nesses dados (com vista à sua preparação para o word2vec).

O word2vec consiste numa rede neuronal voltadas para a reconstrução dos contextos linguísticos de textos (cf. en.wikipedia.org/wiki/Word2vec).
Os dados a processar relacionam-se com palavras, sobretudo nomes de funções de bibliotecas standard do MATLAB.
Observações: Ainda não existe financiamento para este projecto.