Evaluation of Machine Learning models in forecasting Brazilian peanut (arachis hypogea L.) exports

  • Zanette Rafael FATEC Pompéia
  • Mateus Bonacina Zanguettin FATEC Pompéia
  • Deise Deolindo Silva FATEC Pompéia
  • João Ricardo Favan FA
Keywords: Information of Technology, Time series, Foreign Trade

Abstract

Peanut (arachis hypogea L.) is an oilseed that has been gaining strength in Brazilian exports while Information Technology (IT) has increasingly helped in the decision-making process in various segments. Therefore, studies on export forecasts using IT are necessary. Therefore, the present work aims to evaluate different machine learning models, which is a subarea of IT, in forecasting Brazilian peanut exports. To carry out the study, data relating to Brazilian peanut exports were collected, adjusted in time series, and applied to the Linear Regression, Random Forest and Multilayer Perceptron models to evaluate the coefficient of determination (R2), mean squared error (MSE) and the root mean square error (RMSE). During the application of the models, variations in the trend and distribution of data on Brazilian peanut exports were observed, resulting in poor performance of the models. Thus, the evaluation of the models was successful, however the results were ineffective in making predictions.

Author Biographies

Zanette Rafael, FATEC Pompéia

Discente no Curso Superior de Tecnologia em Big Data no Agronegócio da FATEC Pompéia

Mateus Bonacina Zanguettin, FATEC Pompéia

Discente no Curso Superior de Tecnologia em Big Data no Agronegócio da FATEC Pompéia

Deise Deolindo Silva, FATEC Pompéia

Docente no Curso Superior de Tecnologia em Big Data no Agronegócio da FATEC Pompéia

João Ricardo Favan , FA

Docente no Curso Superior de Tecnologia em Big Data no Agronegócio da FATEC Pompéia

References

AMATO, F. Balança comercial registra em 2014 primeiro déficit desde 2000. G1, Brasília, 5 jan. 2015. Disponível em: <https://www.google.com/search?q=como+fazer+referencia+de+noticias&oq=como+fazer+referencia+de+noticias&aqs=chrome..69i57.7963j0j7&sourceid=chrome&ie=UTF-8>. Acesso em: 10 mai. 2023.

ANEFALOS, L. C., MARGARIDO, M. A. Modelos de séries temporais aplicados ao setor de exportação brasileira de flores de corte. XLIV Congresso do Saber. Fortaleza, 23 a 27 de julho de 2006. Disponível em: <http://www.iea.sp.gov.br/ftpiea/congressos/sober-790a.pdf>. Acesso em: 5 jan. 2023.

ASCANIO, E., MALAGOLI, G. A., FREIRE, J. E. Um panorama da exportação do amendoim no interior paulista. Desenvolvimento Rural Sustentável: pesquisas emergentes no contexto da Agricultura e Agroindústria, p.76-89, 01 de janeiro de 2018. Disponível em: <https://www.editoracientifica.com.br/artigos/um-panorama-da-exportacao-do-amendoim-no-interior-paulista>. Acesso em: 5 jan. 2023.

ASSIS, W. T. Avaliação do impacto do uso consuntivo de água para irrigação na Bacia Hidrográfica do Alto Rio das Mortes. Programa de Pós-Graduação em Recursos Hídricos – UFTM. Cuiabá, 2014. Disponível em: <https://ufmt.br/ppgrh/dissertacao/avaliacao-do-impacto-do-uso-consuntivo-de-agua-para-irrigacao-na-bacia-hidrografica-do-alto-rio-das-mortes/>. Acesso em: 1 mai. 2023.

AZANK, F. Como avaliar seu modelo de regressão: As principais métricas para avaliar seus modelos de regressão. Turing Talks, 03 de agosto 2020. Disponível em: <https://medium.com/turing-talks/como-avaliar-seu-modelo-de-regress%C3%A3oc2c8d73dab96>. Acesso em: 2 mai. 2023

BREIMAN, l. Randon Forest. Machine Learning 45, 5-32, outubro de 2001. Disponível em: <https://link.springer.com/article/10.1023/a:1010933404324>. Acesso em: 7 fev. 2023.

BULGARELLI, E. M. B. Caracterização de variedades de amendoim cultivadas em diferentes populações. Jaboticabal, nov. 2008. Disponível em: <https://repositorio.unesp.br/handle/11449/92696>. Acesso em: 29 out. 2022.

CAMPOS, B. A. R. M. Análise comparativa de técnicas para a previsão de séries temporais no contexto de mercados financeiros. Florianópolis, 2020. Disponível em <https://repositorio.ufsc.br/handle/123456789/223843>. Acesso em: 24 mar. 2023.

CARVALHO, R. et al. Avaliação de algoritmos de Machine Learning na cotação do Preço do Contrato Futuro de Milho. Revista eF@tec, Garça, v.11, a.1, outubro 2021. Disponível em: <https://pesquisafatec.com.br/ojs/index.php/efatec/article/view/249>. Acesso em: 24 ago. 2022.

CONAB – COMPANHIA NACIONAL DE ABASTECIMENTO. Produção de amendoim cresce mais de 100% nos últimos 8 anos. 28 de setembro de 2022. Disponível em: <https://www.conab.gov.br/ultimas-noticias/4768-producao-de-amendoim-cresce-mais-de-100-nos-ultimos-8-anos>. Acesso em: 10 jan. 2023

DEMSAR, J. et al. Orange: dada mining toolbox in Python. The Journal of Machine Learning Research, v. 14, n. 1, p. 2349-2353, 1 jan. 2013. Disponível em <https://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf>. Acesso em: 1 mai. 2023.

DIAS, F., LOURENÇO N., RUA, A. Previsão de exportações com seleção de previsores. Portugal, 2018. Disponível em: <https://www.bportugal.pt/paper/previsao-das-exportacoes-com-selecao-de-previsores>. Acesso em: 9 jan. 2023.

FAO - FOOD AND AGRICULTURE ORGANIZATION OF THE UNITED NATIONS. Production. Disponível em: <https://www.fao.org/faostat/en/#data/QI>. Acesso em: 7 jan. 2023.

FAUSSET, L. Fundamentals of Neural Network: Architecture, Algorithm, and Application. New Jersey: Prentice Hall, 1994.

HARRIS, C. R., MILLMAN, K. J., VAN DER WALT, S. J. et al. Array programming with NumPy. Nature 585, 357–362 (2020). DOI: 10.1038/s41586-020-2649-2. Disponível em: <https://numpy.org/>. Acesso em: 30 jan. 2023.

HUSSAIN, M., MAHMUD, I., BARI, S. H. pyHomogeneity: A Python Package for Homogeneity Test of Time Series Data. Journal of Open Research Software. 14 feb. 2023. Disponível em: <https://openresearchsoftware.metajnl.com/articles/10.5334/jors.427>. Acesso em: 5 mai. 2023.

INVESTING. Currencies. Disponível em: <https://br.investing.com/currencies/eur-brl-historical-data>. Acesso em: 7 jan. 2023.

ITC - INTERNATIONAL TRADE CENTRE. Export. Disponível em: <https://www.trademap.org/index.aspx>. Acesso em: 7 jan. 2023.

JETBRAINS. Pycharm - Community Edition. Disponível em: <https://www.jetbrains.com/pt-br/pycharm/>. Acesso em: 12 fev. 2023.

LEGGETTER, C. J., WOODLAND, P. C. Speaker adaptation of HMMS using linear regression. Technical Report. CUED/F-INFENG/TR.181, Cambridge University Engineering Department, 1994. Disponível em: <http://mi.eng.cam.ac.uk/reports/svr-ftp/auto-pdf/leggetter_tr181.pdf>. Acesso em: 10 fev. 2023.

LOURENZANI, W. L., LOURENZANI, A. E. B. S. Perspectivas do agronegócio brasileiro de amendoim. Informações Econômicas, São Paulo, v. 39, n. 2, fevereiro, 2009. Disponível em <http://www.iea.sp.gov.br/ftpiea/publicacoes/IE/2009/tec6-0209.pdf>. Acesso em: 10 jan. 2023.

MARTINS, R., VICENTE, J. R. Demandas por inovação no amendoim paulista. Informações Econômicas, São Paulo, v. 40, n. 5, maio 2010. Disponível em <http://www.iea.sp.gov.br/ftpiea/publicacoes/IE/2010/tec5-0510.pdf>. Acesso em: 7 mai. 2023.

MÁXIMO, W. Queda de preço nas commodities reduz valor das exportações agrícolas do país. Agência Brasil. Brasília, 08 de novembro 2014. Disponível em: <https://agenciabrasil.ebc.com.br/economia/noticia/2014-11/queda-nos-precos-e-nos-embarques-fazem-exportacoes-do-agronegocio>. Acesso em: 10 mai. 2023.

MCKINNEY, W. Data structures for statistical computing in python. Proceedings of the 9th Python in Science Conference, Volume 445, 2010. Disponível em: <https://pandas.pydata.org/>. Acesso em: 30 jan. 2023.

MIGUEL, L. O que é série temporal? ICMC Junior, 04 de outubro de 2021. Disponível em: <https://icmcjunior.com.br/o-que-e-serie-temporal/#:~:text=Uma%20s%C3%A9rie%20temporal%20%C3%A9%20simplesmente,uma%20previs%C3%A3o%20para%20o%20futuro>. Acesso em: 5 mai. 2023.

ONU – ORGANIZAÇÃO DAS NAÇÕES UNIDAS. Trade Data. Disponível em: <https://comtradeplus.un.org/TradeFlow>. Acesso em: 7 jan. 2023.

PAULI, S. T. Z., KLEINA, M., BONAT, W. H. Técnicas de Redes Neurais Artificiais e Regressão Linear Múltipla aplicadas na previsão de valores de importação e exportação no setor de bebidas no Brasil. 2019. IX Congresso Brasileiro de Engenharia de Produção. Ponta Grossa – PR. Disponível em: <https://aprepro.org.br/conbrepro/2019/anais/arquivos/08092019_090853_5d4d6ca5e4964.pdf>. Acesso em: 8 mai. 2023.

PEDREGOSA et al. Scikit-learn: Machine Learning in Python, JMLR 12, pp. 2825- 2830, 2011. Disponível em: <https://scikit-learn.org/stable/about.html#citing-scikit-learn>. Acesso em: 5 jan. 2023.

ROSSATO JÚNIOR, J. A. Amendoim brasileiro: um gigante adormecido. Revista Agroanalysis. p.20-21, junho 2022. Disponível em: <https://bibliotecadigital.fgv.br/ojs/index.php/agroanalysis/article/download/88065/82808>. Acesso em: 9 jan. 2023.

SHER, V. Times Series Modeling using Scikit, Pandas and Numpy. Towards Data Science, 2020. Disponível em: <https://towardsdatascience.com/time-series-modeling-using-scikit-pandas-and-numpy-682e3b8db8d1>. Acesso em: 2 abr. 2023.

SILVA JÚNIOR, G. A. Método de Imputação Incremental, Simples e Eficiente para Dados Ausentes em Sistemas Evolutivos. Centro Federal de Educação Tecnológica de Minas Gerais, 2020. Disponível em: <https://sig.cefetmg.br/sigaa/verArquivo?idArquivo=3010142&key=f3f28db226e2c7a68e556b6fdac17e66>. Acesso em: 2 abr. 2023.

SISCOMEX - SISTEMA INTEGRADO DE COMÉRCIO EXTERIOR. Sistema Harmonizado. Março 2022. Disponível em: <https://www.gov.br/siscomex/pt-br/servicos/aprendendo-a-exportarr/planejando-a-exportacao-1/sistema-harmonizado>. Acesso em: 10 abr. 2023.

SOUZA, J. R. M. Análise e previsão de séries temporais da exportação de produtos florestais brasileiros utilizando a metodologia boxjenkins e redes neurais artificiais. Viçosa (MG). Setembro de 2021. Disponível em: <https://www.locus.ufv.br/handle/123456789/29739>. Acesso em: 5 jan. 2023.

SUASSUNA, T. M. F. Sistema de Produção de Amendoim. Embrapa Algodão, fevereiro de 2014. Disponível em: <https://www.spo.cnptia.embrapa.br/conteudo?p_p_id=conteudoportlet_WAR_sistemasdeproducaolf6_1ga1ceportlet&p_p_lifecycle=0&p_p_state=normal&p_p_mode=view&p_p_col_id=column-1&p_p_col_count=1&p_r_p_-76293187_sistemaProducaoId=3803&p_r_p_-996514994_topicoId=3445>. Acesso em: 1 mai. 2023.

VAN ROSSUM, G., DRAKE JR., F. L. Python reference manual. Centrum voor Wiskunde en Informatica. Amsterdam. 1 jan. 1995. Disponível em: <https://ir.cwi.nl/pub/5008>. Acesso em: 25 jan. 2023.

YANG L. Foreign Trade Export Forecast Based on Fuzzy Neural Network. Complexity, vol. 2021. Disponível em: <https://www.hindawi.com/journals/complexity/2021/5523222/>. Acesso em: 5 jan. 2023.

Published
2023-11-17
Section
Articles