172.

Ribeiro J. S., Teófilo R. F., Martins J. P. A., Ferreira M. M. C., "MELHORIAS NA ANÁLISE DISCRIMINATÓRIA DE CAFÉS COMERCIAIS BRASILEIROS APLICANDO O ALGORITMO DE SELEÇÃO DE VARIÁVEIS OPS® SOBRE DADOS CROMATOGRÁFICOS" ["ADVANCES IN DISCRIMINATORY ANALYSIS OF BRAZILIAN COMMERCIAL COFFEES BY APPLYING THE OPC® ALGORITH FOR VARIABLE SELECTION OF CHROMATOGRAPHIC DATA"]. João Pessoa, PB, 07-11/10/2007: 14o Encontro Nacional de Química Analítica (14o ENQA) [14th National Meeting of Analytical Chemistry (14o ENQA)], CDROM online, (2007) 104. Poster QM046.



Português

MELHORIAS NA ANÁLISE DISCRIMINATÓRIA DE CAFÉS COMERCIAIS BRASILEIROS APLICANDO O ALGORITMO DE SELEÇÃO DE VARIÁVEIS OPS® SOBRE DADOS CROMATOGRÁFICOS

Juliano S. Ribeiro (PQ)1,2*, Reinaldo F. Teófilo (PG)1,  João P. A. Martins (PQ)1 e Márcia M. C. Ferreira (PQ)1
jribeiro@iqm.unicamp.br

1. Universidade Estadual de Campinas (UNICAMP), Instituto de Química: Laboratório de Quimiometria Teórica e Aplicada (LQTA);
2. Instituto Agronômico de Campinas (IAC): Centro de Análise e Pesquisa Tecnológica do Agronegócio do Café "Alcides Carvalho" - Campinas - SP;

Palavras Chave: Seleção de variáveis, PLSDA, café torrado, OPS

Introdução
Atualmente, devido aos recentes avanços computacionais, uma grande quantidade de dados gerada por diferentes instrumentos analíticos vem sendo tratada com sucesso por diversas ferramentas quimiométricas. Dentre essas ferramentas, PLSDA (Partial Least Square - Discriminant Analysis) vem sendo utilizada com o intuito de encontrar variáveis que possam discriminar diferentes classes [1]. Em muitos casos, o número de variáveis geradas pelos instrumentos é relativamente grande e apenas algumas são realmente importantes para expressar certas características ou discriminar classes. Deste modo, é crescente o interesse na seleção destas variáveis que apresentam um alto grau de importância na construção de modelos. Seguido nesta linha, o algoritmo de seleção de variáveis OPS [2] (Ordered Predictor Selection) aparece como uma alternativa nova e de grande importância neste processo. Este algoritmo consiste em três etapas: (1) obtenção de um vetor informativo; (2) ordenamento decrescente das variáveis por este vetor; (3) investigação das variáveis ordenadas. O objetivo deste trabalho é demonstrar o potencial do algoritmo OPS para selecionar variáveis em análises discriminantes.

Experimental
Para este trabalho, 14 amostras de cafés comerciais brasileiros de uma mesma marca foram utilizadas, sendo sete delas extra-forte e as outras sete tradicionais. A técnica analítica de extração utilizada foi a microextração em fase sólida (SPME) [3]. Cada amostra foi analisada em triplicata. Os dados cromatográficos foram organizados em um matriz X(42x7500). Para o alinhamento dos cromatogramas foi utilizado o algoritmo COW [4] e para seleção de 10 amostras para previsão foi utilizado o algoritmo de Kennard e Stone [5].

Resultados e Discussão
O modelo de calibração realizado com os dados sem seleção de variáveis utilizando 3 variáveis latentes (VL) apresentou erro padrão de validação cruzada (RMSECV) de 0,2098 e coeficiente de correlação de validação cruzada (rcv) de 0,932. Na validação cruzada 2 amostras foram classificadas incorretamente. Na previsão mais duas amostras foram classificadas em classes erradas. Utilizando o algoritmo OPS foram selecionadas 800 variáveis das 7500. O modelo de calibração com 3 VL apresentou RMSECV = 0,1288 e rcv = 0,986. Neste modelo, tanto na calibração quanto na previsão todas as amostras foram classificadas corretamente.

Conclusões
A partir dos resultados obtidos em ambos os modelos, fica claro que os dados tratados com o algoritmo de seleção de variáveis OPS apresentam melhores resultados. Outros dados também vêm sendo tratados com a mesma metodologia e apresentam resultados excelentes.

Agradecimentos
A Capes e ao CNPq pelo auxílio financeiro.
____________________________
[1] Barker, M., Rayens, W., J. Chemometr., 17 (2003) 166.
[2] Teófilo, R., et al., 10th Internat. Conf. Chemometr. Anal. Chem. (2006).
[3] Bicchi, C., et al., J. Agric. Food Chem., 50 (2002) 449.
[4] Nielsen, N. P. V., et al., J. Chromatogr. A, 805 (1998) 17.
[5] Kennard, R. W., Stone, L. A., Technometrics, 11 (1969) 137.

14º Encontro Nacinal de Química Analítica


English

ADVANCES IN DISCRIMINATORY ANALYSIS OF BRAZILIAN COMMERCIAL COFFEES BY APPLYING THE OPC® ALGORITH FOR VARIABLE SELECTION OF CHROMATOGRAPHIC DATA

Juliano S. Ribeiro (PQ)1,2*, Reinaldo F. Teófilo (PG)1,  João P. A. Martins (PQ)1 e Márcia M. C. Ferreira (PQ)1
jribeiro@iqm.unicamp.br

1. Universidade Estadual de Campinas (UNICAMP), Instituto de Química: Laboratório de Quimiometria Teórica e Aplicada (LQTA);
2. Instituto Agronômico de Campinas (IAC): Centro de Análise e Pesquisa Tecnológica do Agronegócio do Café "Alcides Carvalho" - Campinas - SP;

Key Words: Variable selection, PLSDA, rosted coffee, OPS

Introduction
Recent computational advances enabled successful treatment of a large quantity of data from different analytical instruments by applying diverse chemometric methods. Among these methods, PLSDA (Partial Least Square - Discriminant Analysis) has been used with the aim to identify variables for discrimination of different classes [1]. There are numerous cases in which the number of variables generated from instruments is relatively large, but only a few variables are important to show certain characteristics or discriminate classes. In this sense, the interest for selection of variables of high importance for model construction, is constantly increasing. Following this idea, the OPS [2] (Ordered Predictor Selection) algorithm for variable selection seems to be a new alternative and a promissing means.The algorithm consists of three steps: (1) obtaining an informative vector; (2) ordering of the variables in decreasing manner by this vector; (3) investigation of the ordered variables. The aim of this work is to show potentials of the OPS algorithm for variable selection in discriminant analyses.

Experimental
In this work, 14 samples of brazilian commercial coffees of the same trademark were used, seven of them being extra strong and the other seven traditional coffees. The analytical technique used was solid phase microextraction (SPME) [3]. Each sample was analyzed in triplicate. The chromatographic data were organized into a matrix X(42x7500). The COW algorithm [4] was used for alignment for chromatograms. The algorithm of Kennard and Stone [5] was used for selection of 10 samples for prediction.

Results and Discussion
Calibration model without variable selection and with 3 latent variables (LVs) had standard error of crossvalidation (RMSECV) equal to 0.2098 and correlation coefficient of crossvalidation (rcv) equal to 0,932. Two samples were classified incorrectly in crossvalidation. Two more samples were misclassified in prediction. When using the OPS algorithm, 800 of 7500 were selected. The calibration model with 3 LVs had RMSECV = 0.1288 and rcv = 0.986. In this model, both in calibration and prediction, all the samples were classified correctly.

Conclusions
Analyzing the obtained results for both models, it becomes clear that the data treatment by the OPS algorithm for variable selection yielded better results. Other data, when treated with the same methodology, also showed excellent results.

Acknowledgements
To Capes and CNPq for financial support.
____________________________
[1] Barker, M., Rayens, W., J. Chemometr., 17 (2003) 166.
[2] Teófilo, R., et al., 10th Internat. Conf. Chemometr. Anal. Chem. (2006).
[3] Bicchi, C., et al., J. Agric. Food Chem., 50 (2002) 449.
[4] Nielsen, N. P. V., et al., J. Chromatogr. A, 805 (1998) 17.
[5] Kennard, R. W., Stone, L. A., Technometrics, 11 (1969) 137.

14º Encontro Nacinal de Química Analítica