Orange Data Mining: A study of information from the integrated reporting of brazilian federal universities

Abstract
The purpose of this study is to analyze, from a data mining perspective, the information from the Integrated Report (IR) in some Brazilian Accounting Units (UPCs) using the Orange Data Mining (ODM) tool. To this end, a qualitative, documentary and exploratory study was carried out through textual analysis practices of financial and non-financial data from the IR of fifteen Brazilian federal universities. Two examples of analyses are presented, focusing on a single fiscal year, 2019, which could be further explored in future studies, considering the expectation of adoption of the International Integrated Reporting Framework (IIRF) by the UPCs in the States and Municipalities. The results of the practical approach in the execution of the ODM demonstrated that the intuitive characteristics of the tool can facilitate the analyses by different profiles of researchers, from beginners to the most experienced, and constitutes an opportunity for different analyses of the aforementioned IR data. The contributions of the research may integrate the literature on the use of ODM in the public sector, in encouraging students, public servants, including those in control, in the practice of evaluating IR information, especially in social control and transparency.
Keywords
data mining, orange, analysis, integrated report, universities
Author Biography
João Eudes de Souza Calado
Doutorando em Ciências Contábeis pela Universidade de Brasília (UnB), mestre em Contabilidade e Controladoria pela FUCAPE (ES) e especialista em Ensino Superior, Contemporaneidade e Novas Tecnologias pela UNIVASF (PE). Professor voluntário de Orçamento e Finanças Públicas – Mestrado PROFIAP e TAE da Seção de Prestação de Contas da UNIVASF (PE).
José Matias-Pereira
Doutor em Ciências Políticas pela Universidade Complutense de Madrid, pós-doutor em Administração pela FEA/USP, professor de Administração e Finanças Públicas e pesquisador sênior do Programa de Pós-Graduação em Ciências Contábeis da Universidade de Brasília (UnB).
Abimael de Jesus Barros Costa
Doutor em Transportes e mestre em Contabilidade pela Universidade de Brasília (UnB), pós-doutor em Contabilidade Pública pela Universidade de Valência (Espanha). Pró-Reitor de Administração e Professor do Programa de Pós-Graduação em Ciências Contábeis da Universidade de Brasília (UnB). Ex-Auditor-Chefe da UnB e do Cebraspe.
References
- ALEXANDRE, Cláudio Reginaldo; BALSA, João. Incorporating machine learning and a risk-based strategy in an anti-money laundering multiagent system. Expert Systems With Applications, [s. l.], v. 217, 119500, maio 2023. DOI: https://doi.org/10.1016/j.eswa.2023.119500. Disponível em: https://www.sciencedirect.com/science/article/pii/S0957417423000015?via%3Dihub. Acesso em: 12 abr. 2024.
- ARAÚJO, Ricardo Henrique Miranda de; CALLADO, Antônio André Cunha. Características qualitativas da informação contábil: a percepção de profissionais de controle interno do setor público. Management Control Review, Universidade Federal Rural de Pernambuco, v. 5, n. 1, p. 47-65, jan./jun. 2020. DOI: https://doi.org/10.51720/mcr.v5i1.3696. Disponível em: https://www.journals.ufrpe.br/index.php/managementcontrolreview/article/view/3696. Acesso em: 12 jan. 2024.
- AUDIBERT, Julien; MICHIARDI, Pietro; GUYARD, Frédéric; MARTI, Sébastien; ZULUAGA, Maria A. USAD: UnSupervised anomaly detection on multivariate time series. In: Proceedings of the 26th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD ’20), ago. 2020, Virtual. p. 3395-3404. DOI: https://doi.org/10.1145/3394486.3403392. Disponível em: https://dl.acm.org/doi/10.1145/3394486.3403392. Acesso em: 15 abr. 2023.
- AUDIBERT, Julien; MICHIARDI, Pietro; GUYARD, Frédéric; MARTI, Sébastien; ZULUAGA, Maria A. Do deep neural networks contribute to multivariate time series anomaly detection? Pattern Recognition, [s. l.], v. 132, 108945, dez. 2022. DOI: https://doi.org/10.1016/j.patcog.2022.108945. Disponível em: https://www.sciencedirect.com/science/article/pii/S0031320322004253?via%3Dihub. Acesso em: 14 abr. 2024.
- BAGAGI, Leone C. Dinâmica de inovação em diferentes modelos de gestão hospitalar. 2022. Tese (Doutorado em Administração) – Universidade Federal da Bahia, Escola de Administração, Salvador, 2022. Disponível em: https://repositorio.ufba.br/handle/ri/36038. Acesso em: 15 abr. 2023.
- BRASIL. Tribunal de Contas da União. Decisão Normativa nº 170, de 19 de setembro de 2018. Dispõe acerca das unidades cujos dirigentes máximos devem prestar contas de suas gestões ocorridas no exercício de 2018, especificando a forma, os conteúdos e os prazos de apresentação, nos termos do art. 3º da Instrução Normativa TCU 63, de 1º de setembro de 2010. Brasília: TCU, 2018. Disponível em:
- https://portal.tcu.gov.br/contas/contas-e-relatorios-de-gestao/contas-do-exercicio-de-2018.htm. Acesso em: 16 abr. 2023.
- BRASIL. Tribunal de Contas da União. Instrução Normativa nº 84, de 22 de abril de 2020. Estabelece normas para a tomada e prestação de contas dos administradores e responsáveis da administração pública federal, para fins de julgamento pelo Tribunal de Contas da União, nos termos do art. 7º da Lei 8.443, de 1992, e revoga as Instruções Normativas TCU 63 e 72, de 1º de setembro de 2010 e de 15 de maio de 2013, respectivamente. Brasília: TCU, 2020. https://www.gov.br/defesa/pt-br/arquivos/lai/transparencia_e_prestacao_de_contas/Norma_InTcu84.2020.pdf. Acesso em: 15 abr. 2023.
- CALADO, João Eudes de Souza; MATIAS-PEREIRA, José; RODRIGUES, Evaldo César Cavalcante; COSTA, Abimael de Jesus Castro. Tópicos contemporâneos da pesquisa contábil no setor público sob a ótica interdisciplinar: um estudo exploratório e descritivo. Revista de Gestão e Contabilidade da UFPI, no prelo.
- CAMILO, Cássio Oliveira; SILVA, João Carlos da. Mineração de dados: conceitos, tarefas, métodos e ferramentas. Relatório técnico, Instituto de Informática, Universidade Federal de Goiás (UFG), p. 1-29, 2009. Disponível em: https://ww2.inf.ufg.br/node/355. Acesso em: 15 abr. 2023.
- CASTRO, Sarah; COSTA, Abimael. O status quo do relato integrado no setor público brasileiro. Revista Gestão Organizacional, Chapecó, v. 15, n. 3, p. 254-270, set./dez, 2022. DOI: https://doi.org/10.22277/rgo.v15i3.6542. Disponível em: https://bell.unochapeco.edu.br/revistas/index.php/rgo/article/view/6542. Acesso em: 15 jan. 2024.
- CURK, Tomaz.; DEMSAR, Janez; XU, Qikai; LEBAN, Gregor; PETROVIC, Uros; BRATKO, Ivan; SAULSKY, Gad; ZUPAN, Blaz. Microarray data mining with visual programming. Bioinformatics, Oxford University, v. 21, n. 3, p. 396-398, fev. 2005. DOI: https://doi.org/10.1093/bioinformatics/bth474. Disponível em: https://academic.oup.com/bioinformatics/article/21/3/396/237562. Acesso em: 15 abr. 2023.
- DEMSAR, Janez; CURK, Tomaz.; ERJAVEC, Ales.; GORUP, Crt.; HOCEVAR, Tomaz; MILUTINOVIC, Mitar; MOZINA, Martin; POLAJNAR, Matija; TOPLAK, Marko; STARIC, Anze; STAJDOHAR, Miha; UMEK, Lan; ZAGAR, Lan; ZBONTAR, Jure; ZITNIK, Marinka; ZUPAN, Blaz. Orange: Data Mining Toolbox in Python, Journal of Machine Learning Research, [s. l.], v. 14, p. 2349-2353, ago. 2013. Disponível em: https://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf. Acesso em: 15 abr. 2023.
- DEMSAR, Janez; ZUPAN, Blaz; LEBAN, Gregor; CURK, Tomaz. Orange: from experimental machine learning to interactive Data Mining. In: BOULICAUT, Jean-François; ESPOSITO, Floriana; GIANNOTTI, Fosca; PEDRESCHI, Dino (eds.). Knowledge discovery in databases: PKDD 2004. Springer-Verlag Berlin Heidelberg, 2004. p. 537-539. Disponível em: https://link.springer.com/chapter/10.1007/978-3-540-30116-5_58. Acesso em: 16 abr. 2023.
- DUMAY, John; BERNARDI, Cristiana; GUTHRIE, James; DEMARTINI, Paola. Integrated Reporting: A Structured Literature Review. Accounting Forum, Londres, v. 40, n. 3, p. 166-185, 2016. DOI: http://dx.doi.org/doi:10.1016/j.accfor.2016.06.001. Disponível em: https://www.tandfonline.com/doi/full/10.1016/j.accfor.2016.06.001. Acesso em: 21 abr. 2023.
- FATIMA, Samar; SOUZA, Kevin C. de; DAWSON, Gregory S. National strategic artificial intelligence plans: a multi-dimensional analysis. Economic Analysis and Policy, Austrália, v. 67, p. 178-194, set. 2020. DOI: https://doi.org/10.1016/j.eap.2020.07.008. Disponível em: https://www.sciencedirect.com/science/article/pii/S0313592620304021?via%3Dihub. Acesso em: 18 jan. 2024.
- GUTHRIE, James; PARKER, Lee D.; DUMAY, John; MILNE, Markus J. What counts for quality in interdisciplinary accounting research in the next decade: a critical review and reflection. Accounting, Auditing & Accountability Journal, [s. l.], v. 32, n. 1, p. 2-25, jan. 2019. DOI: https://doi.org/10.1108/AAAJ-01-2019-036. Disponível em: https://www.emerald.com/insight/content/doi/10.1108/AAAJ-01-2019-036/full/html. Acesso em: 21 abr. 2023.
- HOZAIRI, Hozairi; ANWARI, Anwari; ALIM, Syariful. Orange Data mining implementation for student graduation classification using K-Nearest Neighbor, Decision Tree and Naive Bayes Models. Network Engineering Research Operation, [s. l.], v. 6, n. 2, 2021. Disponível em: https://www.mendeley.com/catalogue/e4e2d21c-9a8a-3ba8-9a3a-252e01bb9dfc/. Acesso em: 2 jun. 2023.
- INTERNATIONAL INTEGRATED REPORTING COUNCIL. Integrated Reporting Framework. Londres: IIRC, 2013. Disponível em: https://www.integratedreporting.org/resource/international-ir-framework/. Acesso em: 22 abr. 2023.
- JOVIC, Alan; BRKIC, Karla; BOGUNOVIC, Nikola. An overview of free software tools for general data mining. In: International Convention on Information and Communication Technology, Electronics and Microelectronics, 37., 2014. Opatija: IEEE Xplore, 2014. p. 1112-1117. Disponível em: https://ieeexplore.ieee.org/document/6859735. Acesso em: 15 abr. 2024.
- KODATI, Sarangam; VIVEKANANDAM, Reethu. Analysis of heart disease using in data mining tools Orange and Weka. Global Journal of Computer Science and Technology, [s. l.], v. 18, n. 1, versão 1.0, 2018. Disponível em:
- https://api.semanticscholar.org/CorpusID:145873002. Acesso em: 15 abr. 2023.
- MARWA, Emelia Aprodaid; KRISTANTO, Ari Budi. Analisis sentimen pengungkapan informasi manajemen: text mining berbasis metode VADER. Owner: Riset Dan Jurnal Akuntansi, [s. l.], v. 6, n. 3, p. 2973-2984, jul. 2022. DOI: https://doi.org/10.33395/owner.v6i3.895. Disponível em: https://owner.polgan.ac.id/index.php/owner/article/view/895. Acesso em: 12 jun. 2023.
- OTIA, Javis Ebua; BRACCI, Enrico. Digital transformation and the public sector auditing: the SAI’s perspective. Financial Accountability & Management, [s. l.], v. 38, n. 2, p. 252-280, maio 2022. DOI: https://doi.org/10.1111/faam.12317. Disponível em: https://onlinelibrary.wiley.com/doi/10.1111/faam.12317. Acesso em: 22 jan. 2024.
- PEKER, Musa; ÖZKARACA, Osman; ŞAŞAR, Ali. Use of Orange Data Mining Toolbox for data analysis in clinical decision making: the diagnosis of diabetes disease. IGI Global, Harshey, cap. 7, p. 143-167, 2018. Disponível em: https://www.igi-global.com/gateway/chapter/205478. Acesso em: 2 jun. 2023.
- VAISHNAV, Devashree; RAO, B. Rama. Comparison of machine learning algorithms and fruit classification using Orange Data Mining Tool. In: International Conference on Inventive Computation Technologies, 3, 2020. Coimbatore: IEEE Xplore, 2020. Disponível em: https://ieeexplore.ieee.org/document/9034442. Acesso em: 15 abr. 2024.
- WAHBERH, Abdullah H.; AL-RADAIDEH, Qasem A.; AL-KABI, Mohammed N.; AL-SHAWAKFA, Emad M. A comparison study between Data Mining Tools over some classification methods. International Journal of Advanced Computer Science and Applications, [s. l.], v. 8, n. 2, p. 18-26, 2011. Disponível em: https://thesai.org/Publications/ViewPaper?Volume=1&Issue=3&Code=SpecialIssue&SerialNo=4. Acesso em: 5 jun. 2023.
- WIGUNA, Ratu Aghnia Raffaidy; RIFAI, Andri Irfan. analisis text clustering masyarakat di twitter mengenai omnibus law menggunakan Orange Data Mining. Journal of Information Systems and Informatics, [s. l.], v. 3, n. 1, p. 1-12, mar. 2021. DOI: https://doi.org/10.33557/journalisi.v3i1.78. Disponível em: https://journal-isi.org/index.php/isi/article/view/78. Acesso em: 19 abr. 2024.
- WIRTZ, Bernd. W.; WEYERER, Jan C.; GEYER, Carolin. Artificial Intelligence and the public sector: applications and challenges. International Journal of Public Administration, Londres, v. 42, n. 7, p. 596-615, jul. 2018. DOI: https://doi.org/10.1080/01900692.2018.1498103. Disponível em: https://www.tandfonline.com/doi/full/10.1080/01900692.2018.1498103. Acesso em: 10 jan. 2024.
- ZHANG, Shichao; ZHANG, Chengqi; YANG, Qiang. Data preparation for Data Mining. Applied Artificial Intelligence, Taylor & Francis, v. 17, n. 5-6, p. 375-381, 2003. DOI: https://doi.org/10.1080/713827180. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/713827180. Acesso em: 15 abr. 2023.