O câncer de mama é o tipo de câncer mais comum entre as mulheres em todo o mundo, sendo o segundo mais freqüente de acordo com o Instituto Nacional do Câncer. Devido o câncer de mama ser um assunto muito discutido e vivenciado por muitas mulheres, surgiu a intenção de pesquisar o assunto e colocar em prática os estudos obtidos durante o curso de reconhecimento de padrões a fim de analisar os algoritmos e suas predições para doença.
A Base de dados foi extraída do site UCI Repository, com 569 registros e 30 atributos, sendo 37,25% (Maligno) e 62,74% (Benigno). As informações são referentes às características das células extraídas via pulsão das mamas para investigação do diagnóstico (MALIGNO ou BENIGNO). O processamento foi dividido em 70% treinamento e 30% aprendizado, foram utilizados diferentes classificadores e técnicas para predição do diagnóstico e dentre as quais a técnica de Regressão Logística obteve o melhor resultado, com acurácia de 99,64%. Foi pontuado que o modelo obteve ótimo desempenho, sendo observado que os atributos apresentaram grande relevância e significado.
O estudo atendeu ao propósito de apoiar a área de diagnósticos com resultado satisfatório, visando cada vez mais colocar máquinas a serviço da saúde, objetivando diminuição do prazo dos resultados, procedimentos menos invasivos e principalmente redução de custos.