|
Proposta de dissertação do MEI |
Título: |
*** Detecção com word2vec de concerns em bases de código |
Proponente(s): |
Miguel Pessoa Monteiro (DI/FCT/UNL)
Nuno Cavalheiro Marques (DI/FCT/UNL) |
Créditos: |
42 ECTS |
Área científica: |
Decision Support and Artificial Intelligence |
Início preferencial: |
Qualquer semestre |
URL: |
|
Já estão em curso trabalhos preliminares executados pelo alunos: |
Bruno Palma trabalhou nesta frente. Bruno Jota está a continuá-lo no contexto da sua tese |
Breve descrição: |
Projecto consiste em investigar uma técnica para a detecção automática de concerns (conceitos ou abstracções enquanto módulos latentes) em bases de código de linguagens voltadas para a análise de dados (e.g., R, Python, MATLAB). Neste projecto, serão repositórios MATLAB de grandes dimensões.
A técnica consiste na extracção de dados de repositórios MATLAB (já existe uma ferramenta Java, que poderá requerer extensões) e subsequente computação de métricas baseadas nesses dados (com vista à sua preparação para o word2vec).
O word2vec consiste numa rede neuronal voltadas para a reconstrução dos contextos linguísticos de textos (cf. en.wikipedia.org/wiki/Word2vec).
Os dados a processar relacionam-se com palavras, sobretudo nomes de funções de bibliotecas standard do MATLAB. |
Observações: |
Ainda não existe financiamento para este projecto. |
|