Proposta de dissertação do MEI
Título: Cross-modal hashing for efficient search in indexes with over 1 biilion entries
Proponente(s): João Magalhães
Créditos: 42 ECTS
Área científica: Decision Support and Artificial Intelligence
Início preferencial: Qualquer semestre
URL:
Já estão em curso trabalhos preliminares executados pelo alunos:
Breve descrição: O aumento da quantidade de informação na Web tem vindo a dificultar a tarefa dos motores de pesquisa a identificar a informação relevante. Esta dificuldade é acrescida pelo facto de existirem duplicados, informação spam, e outras situações relacionadas com a análise da informação.

Um tema actual na comunidade de motores de pesquisa/recuperação de informação está relacionado com a geração de hash codes que permitem não só pesquisar encontrar os resultados correctos como realizar essa tarefa com um custo O(log n).

Nesta tese pretende-se estender uma das soluções do estado da arte para permitir pesquisa em dados dinâmicos.

Os melhores algoritmos desenvolvidos serão integrados num motor de pesquisa.
Observações: - Pré-requisitos: Recuperação de informação + Aprendizagem Automática

- Aconselhado a alunos com média >= 15.

- O benchmark do estado da arte:
https://github.com/erikbern/ann-benchmarks

- Existe possibilidade de bolsa.