Agrupamento, Extração de Tópicos e Subclassificação de Projetos da Lei Rouanet

A Lei Rouanet desde sua criação em 1991 já fomentou cerca de 100 mil projetos culturais, cujo montante total gira em torno de 30 bilhões de reais. Atualmente esses projetos são divididos em 7 grandes áreas: Artes Cênicas, Audiovisual, Música, Artes Visuais, Patrimônio Cultural, Humanidades, Artes Integradas. Todavia, essas áreas devem abarcar uma enorme gama de projetos diversos, cada um com suas particularidades, podendo tornar o acesso ao público ineficiente. Na nossa atual conjuntura política e social, a demanda por maior transparência faz com que seja essencial que sistemas governamentais tenham seu acesso eficiente, para que a população possa fazer melhor uso dos dados neles contidos. Neste trabalho utilizamos uma base com aproximadamente 80 mil projetos onde extraímos seus respectivos resumos textuais. Fizemos uso da técnica de agrupamento K-means, reagrupando em sub áreas cada área pré definida. Com acurácia média de 0.028 aferida por silhueta, extraímos as palavras chaves de maior significância para cada subclasse. A partir dessas sub classes descobertas, treinamos os classificadores Nearest Centroid, Ridge Classifier, SVM, Perceptron, Passive Aggressive, Regressão Logística, Random

Forest, KNN e Naive Bayes. Os 3 classificadores com melhor acurácia aferida foram Nearest Centroid, SVM e Passive Aggressive, com 85%, 79% e 77% respectivamente. A partir desses classificadores treinados, é possível classificar em sub área projetos novos inseridos na base. Os resultados obtidos podem ser usados para incrementar algum sistema atual ou criar novos sistemas que auxiliem os cidadãos a terem acesso mais significativo à esses dados públicos bem como potencialmente servir de apoio à agentes públicos para melhor gestão dos recursos direcionados para a lei em questão.

Ajude-nos a divulgar o evento

Faça um Tweet ou publique um post no Facebook.

Escolha uma rede social, clique no botão correspondente e confirme a postagem para ser redirecionado para o conteúdo (você poderá ver o texto a ser publicado antes de confirmar).

Enviar Tweet Postar no Facebook