Attribute selection in bankruptcy prediction: application and evaluation using recent Brazilian data/Selecao de atributos na previsao de insolvencia: aplicacao e avaliacao usando dados Brasileiros recentes/Selección de atributos en previsión de insolvencia: aplicación y evaluación utilizando datos recientes de Brasil

Bankruptcy prediction may have great utility to financial and nonfinancial institutions with regard to take in advance the best possible decisions regarding loans or investments. In specific literature, many bankruptcy prediction models have made use of data mining. The preprocessing step is importa...

Full description

Saved in:
Bibliographic Details
Published inRevista de administração Mackenzie Vol. 15; no. 1; p. 125
Main Authors Horta, Rui Americo Mathiasi, Alves, Francisco Jose Dos Santos, De Carvalho, Frederico Antonio Azevedo
Format Journal Article
LanguageSpanish
Published Universidade Presbiteriana Mackenzie 01.01.2014
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Bankruptcy prediction may have great utility to financial and nonfinancial institutions with regard to take in advance the best possible decisions regarding loans or investments. In specific literature, many bankruptcy prediction models have made use of data mining. The preprocessing step is important to select good quality data for use in mining operations. Still, although the selection of attributes can be very beneficial to pre-select representative data to improve the forecast performance end, it is not known which method is the best selection. This work has as main objective to compare two approaches for evaluating subsets of attributes: Filter and Wrapper. Despite being based on data mining techniques and widely used in the step of feature selection in bankruptcy prediction models, these techniques are rarely used to treat data from financial statements of Brazilian companies. Therefore the empirical basis of this study consists of a sample of Brazilian industrial and commercial enterprises, collecting data for the period 2004 to 2011. The results indicated that, in this sample, the filter approach was more efficient, providing better classification results both for logistic regression (91,80%) and for neural networks (93,98%). It was shown also the importance of making explicit the evaluation stage of the selection of attributes for achieving better results in applications of data mining techniques to predict insolvency. A specific conclusion about the advantages of the filter approach shows that it may be preferred to assess the attributes that will make predictive models. KEYWORDS Financial indicators. Forecast insolvency. Data mining. Attribute selection. Filter and wrapper. Previsao de falencias pode ter grande utilidade para instituicoes financeiras e nao financeiras no que se refere a tomar, antecipadamente, as melhores decisoes possiveis quanto a emprestimos ou investimentos. Na literatura especifica, muitos modelos de previsao de falencia tem feito uso de tecnicas de data mining (mineracao de dados). O pre-processamento e passo importante para selecionar dados de boa qualidade para utilizacao em operacoes de mineracao. Mesmo assim, apesar de a selecao de atributos poder ser muito benefica para pre-selecionar dados representativos visando melhorar o desempenho da previsao final, nao se sabe que metodo de selecao e o melhor. Este trabalho tem como objetivo principal comparar as duas abordagens mais utilizadas de avaliacao de subconjuntos de atributos: Filtro e Wrapper. Apesar de serem fundamentadas em tecnicas de mineracao de dados e muito utilizadas na etapa de selecao de atributos em modelos de previsao de insolvencia, essas tecnicas sao muito pouco utilizadas para tratar dados obtidos em demonstrativos contabeis de empresas brasileiras. Por isso, a base empirica deste estudo consiste em uma amostra de empresas comerciais e industriais brasileiras, coletando-se dados relativos ao periodo 2004-2011. Os resultados indicaram que, na amostra estudada, a abordagem Filtro foi a mais eficiente, fornecendo melhores resultados de classificacao tanto para a tecnica de regressao logistica (91,80%), quanto para redes neurais (93,98%). Foi demonstrada, ainda, a importancia da explicitacao da etapa de avaliacao da selecao de atributos para a obtencao de melhores resultados em aplicacoes de tecnicas de mineracao de dados na previsao de insolvencia. Uma conclusao especifica a respeito das vantagens da abordagem Filtro aponta que ela pode ser a preferida para avaliar os atributos que irao compor os modelos preditivos. PALAVRAS-CHAVE Indices economico-financeiros. Previsao de insolvencia. Mineracao de dados. Selecao de atributos. Abordagens Filtro e Wrapper. Prediccion de bancarrota puede tener gran utilidad para las instituciones financieras y no financieras con respecto a tomar de antemano las mejores decisiones posibles con respecto a los prestamos o inversiones. En la literatura especifica, muchos de los modelos de prediccion de bancarrota han hecho uso de mineria de datos (data mining). En la etapa de pre-procesamiento es importante seleccionar datos de buena calidad para su uso en las operaciones mineras. Sin embargo, aunque la seleccion de atributos puede ser muy beneficioso para los datos representativos pre-seleccion para mejorar el rendimiento final previsto, no se sabe que metodo es la mejor seleccion. Este trabajo tiene como principal objetivo comparar dos enfoques para la evaluacion de los subconjuntos de atributos: con filtro y envoltura. A pesar de que se basan en tecnicas de mineria de datos y ampliamente utilizados en la seleccion de caracteristicas en los modelos de prediccion de la etapa de la insolvencia, estas tecnicas son raramente utilizados para tratar datos de los estados financieros de las empresas brasilenas. Asi que la base empirica de este estudio consiste en una muestra de empresas comerciales e industriales de Brasil, mediante la recopilacion de datos para el periodo 2004-2011. Los resultados indicaron que, en este ejemplo, el enfoque de filtro fue mas eficiente, proporcionando mejores resultados de la clasificacion tanto para la regresion logistica (91,80%) y de redes neuronales (93,98%). Tambien se demostro la importancia de hacer explicita la etapa de evaluacion de la seleccion de atributos para lograr mejores resultados en la aplicacion de tecnicas de mineria de datos para predecir la insolvencia. Una conclusion especifica acerca de las ventajas del enfoque de filtro de muestra que puede ser preferible para evaluar los atributos que haran modelos predictivos. PALABRAS CLAVE Indicadores financieros. Insolvencia. Mineria de datos. Seleccion de atributos. Filtro y envoltura enfoques.
ISSN:1518-6776