Com uma parceria com o instituto Oswaldo Cruz (Fiocruz) este trabalho tem como objetivo desenvolver um sistema de imagem hiperespectral para a detecção e classificação de protozoários a fim de reduzir custos e tempo de análise.
Atualmente, muitos países de terceiro mundo sofrem com doenças negligenciadas, muitas se devem por infecção com protozoários variados. Geralmente a detecção da existência e tipo do protozoário em amostras é dada por análises química ou dependendo até decodificação genética.
Métodos clássicos como esses demandam um tempo de análise que no caso do sequenciamento genético é até 5 cinco dias, além do custo elevado em material e personal especializado.
O desenvolver deste trabalho é dados em duas partes, uma proposta com métodos clássicos do estado-da-arte em Machine Learning e enquanto a outra utiliza técnicas e melhorias recentes no âmbito de Deep Learning.
Os dados utilizados são photografias hiperespectrais de amostras de 4 protozoários, os protozoários caracterizados pelo método padrão de isoenzimas: Leishmania guyanensis e Leishmania chagasi e os protozoários caracterizados por sequenciamento gênico: Trypanosoma cruzi e Giardia lamblia.
Na primeira proposta foi feita uma combinação de análise de componentes principais (PCA) e o classificadores Gaussianos com obtenção 87% de precisão no melhor dos casos. Em adição a boa acurácia foi possível notar a grande semelhança entre a Trypanosoma cruzi e Giardia lamblia, fato observável pela necessidade de utilizar sequenciamentos genético em métodos tradicionais. Na segunda parte do trabalho foi proposto a fase de extração de características espaciais e espectrais usando redes neurais convolucionais (CNNs).
A precisão obtida nessa fase do trabalho alcançou 95% de acurácia. Adicionalmente aos resultados promissores na classificação foi desenvolvida uma solução utilizando decomposições tensor que se mostrou capaz de equilibrar a alta dimensionalidade dos dados com o número de parâmetros necessários na camadas da rede neural.