Abstract
Este trabalho propõe uma metodologia de documentação de projetos de mineração de
dados (DM), Rastro-DM, com foco não no modelo gerado, mas no processo por trás de
sua construção, de forma a deixar um rastro das ações planejadas, dos treinamentos
realizados, dos resultados obtidos e dos aprendizados concebidos. As práticas propostas são
complementares às metodologias estruturantes de DM, como o CRISP-DM, que trazem todo
o arcabouço metodológico e paradigmático para o processo de DM. Ilustra-se o seu uso e
seus benefícios em um projeto de classivcação textual de documentos em PDF associados a
danos ao Erário Público Federal Brasileiro denominado Cladop. A produção do Rastro-DM de
um projeto é um pequeno passo que pode levar a um salto organizacional, a ser obtido com a
partilha e o uso dos rastros de forma corporativa.
1 Trata-se de uma versão sintetizada do trabalho de conclusão de curso de pós-graduação lato sensu em Análise de
Os textos aprovados são publicados sem alteração de conteúdo. Os conceitos e opiniões emitidas em trabalhos doutrinários assinados são de inteira responsabilidade de seus autores. Os artigos publicados poderão ser divulgados em outros canais, desde que citada a Revista do TCU, ano, número e data de publicação como primeiro veiculador do trabalho.
Direitos de uso
Isso quer dizer que é permitido compartilhar, copiar e redistribuir o material em qualquer suporte ou formato, desde que citados o autor do artigo e a fonte (Revista do TCU, número da edição e página).
O licenciante não pode revogar estes direitos desde que você respeite os termos da licença.
<https://creativecommons.org/licenses/by-nc-sa/4.0/deed.pt_BR >. Para mais informações, acesse o site indicado.