Ribeiro J. S., Teófilo R. F., Martins J. P. A., Ferreira M. M. C., "MELHORIAS NA ANÁLISE DISCRIMINATÓRIA DE CAFÉS COMERCIAIS BRASILEIROS APLICANDO O ALGORITMO DE SELEÇÃO DE VARIÁVEIS OPS® SOBRE DADOS CROMATOGRÁFICOS" ["ADVANCES IN DISCRIMINATORY ANALYSIS OF BRAZILIAN COMMERCIAL COFFEES BY APPLYING THE OPC® ALGORITH FOR VARIABLE SELECTION OF CHROMATOGRAPHIC DATA"]. João Pessoa, PB, 07-11/10/2007: 14o Encontro Nacional de Química Analítica (14o ENQA) [14th National Meeting of Analytical Chemistry (14o ENQA)], CDROM online, (2007) 104. Poster QM046.
MELHORIAS NA ANÁLISE DISCRIMINATÓRIA DE CAFÉS COMERCIAIS BRASILEIROS APLICANDO O ALGORITMO DE SELEÇÃO DE VARIÁVEIS OPS® SOBRE DADOS CROMATOGRÁFICOS
Juliano S. Ribeiro (PQ)1,2*,
Reinaldo F. Teófilo (PG)1,
João P. A. Martins (PQ)1 e Márcia
M. C. Ferreira (PQ)1
jribeiro@iqm.unicamp.br
1. Universidade Estadual de Campinas (UNICAMP), Instituto de Química:
Laboratório de Quimiometria Teórica e Aplicada (LQTA);
2. Instituto Agronômico de Campinas (IAC): Centro de Análise
e Pesquisa Tecnológica do Agronegócio do Café "Alcides
Carvalho" - Campinas - SP;
Palavras Chave: Seleção de variáveis, PLSDA, café torrado, OPS
Introdução
Atualmente, devido aos recentes avanços computacionais,
uma grande quantidade de dados gerada por diferentes instrumentos analíticos
vem sendo tratada com sucesso por diversas ferramentas quimiométricas.
Dentre essas ferramentas, PLSDA (Partial Least Square - Discriminant Analysis)
vem sendo utilizada com o intuito de encontrar variáveis que possam
discriminar diferentes classes [1]. Em muitos casos, o número de
variáveis geradas pelos instrumentos é relativamente grande
e apenas algumas são realmente importantes para expressar certas
características ou discriminar classes. Deste modo, é crescente
o interesse na seleção destas variáveis que apresentam
um alto grau de importância na construção de modelos.
Seguido nesta linha, o algoritmo de seleção de variáveis
OPS [2] (Ordered Predictor Selection) aparece como uma alternativa nova
e de grande importância neste processo. Este algoritmo consiste em
três etapas: (1) obtenção de um vetor informativo;
(2) ordenamento decrescente das variáveis por este vetor; (3) investigação
das variáveis ordenadas. O objetivo deste trabalho é demonstrar
o potencial do algoritmo OPS para selecionar variáveis em análises
discriminantes.
Experimental
Para este trabalho, 14 amostras de cafés comerciais
brasileiros de uma mesma marca foram utilizadas, sendo sete delas extra-forte
e as outras sete tradicionais. A técnica analítica de extração
utilizada foi a microextração em fase sólida (SPME)
[3]. Cada amostra foi analisada em triplicata. Os dados cromatográficos
foram organizados em um matriz X(42x7500). Para o alinhamento dos
cromatogramas foi utilizado o algoritmo COW [4] e para seleção
de 10 amostras para previsão foi utilizado o algoritmo de Kennard
e Stone [5].
Resultados e Discussão
O modelo de calibração realizado com os
dados sem seleção de variáveis utilizando 3 variáveis
latentes (VL) apresentou erro padrão de validação
cruzada (RMSECV) de 0,2098 e coeficiente de correlação de
validação cruzada (rcv) de
0,932. Na validação cruzada 2 amostras foram classificadas
incorretamente. Na previsão mais duas amostras foram classificadas
em classes erradas. Utilizando o algoritmo OPS foram selecionadas 800 variáveis
das 7500. O modelo de calibração com 3 VL apresentou RMSECV
= 0,1288 e rcv = 0,986. Neste modelo, tanto
na calibração quanto na previsão todas as amostras
foram classificadas corretamente.
Conclusões
A partir dos resultados obtidos em ambos os modelos,
fica claro que os dados tratados com o algoritmo de seleção
de variáveis OPS apresentam melhores resultados. Outros dados também
vêm sendo tratados com a mesma metodologia e apresentam resultados
excelentes.
Agradecimentos
A Capes e ao CNPq pelo auxílio financeiro.
____________________________
[1] Barker, M., Rayens, W., J. Chemometr., 17
(2003)
166.
[2] Teófilo, R., et al., 10th Internat.
Conf. Chemometr. Anal. Chem. (2006).
[3] Bicchi, C., et al., J. Agric. Food Chem.,
50 (2002) 449.
[4] Nielsen, N. P. V., et al., J. Chromatogr.
A, 805 (1998) 17.
[5] Kennard, R. W., Stone, L. A., Technometrics,
11 (1969) 137.
14º Encontro Nacinal
de Química Analítica
English
ADVANCES IN DISCRIMINATORY ANALYSIS OF BRAZILIAN COMMERCIAL COFFEES BY APPLYING THE OPC® ALGORITH FOR VARIABLE SELECTION OF CHROMATOGRAPHIC DATA
Juliano S. Ribeiro (PQ)1,2*,
Reinaldo F. Teófilo (PG)1,
João P. A. Martins (PQ)1 e Márcia
M. C. Ferreira (PQ)1
jribeiro@iqm.unicamp.br
1. Universidade Estadual de Campinas (UNICAMP), Instituto de Química:
Laboratório de Quimiometria Teórica e Aplicada (LQTA);
2. Instituto Agronômico de Campinas (IAC): Centro de Análise
e Pesquisa Tecnológica do Agronegócio do Café "Alcides
Carvalho" - Campinas - SP;
Key Words: Variable selection, PLSDA, rosted coffee, OPS
Introduction
Recent computational advances enabled successful treatment
of a large quantity of data from different analytical instruments by applying
diverse chemometric methods. Among these methods, PLSDA (Partial Least
Square - Discriminant Analysis) has been used with the aim to identify
variables for discrimination of different classes [1]. There are numerous
cases in which the number of variables generated from instruments is relatively
large, but only a few variables are important to show certain characteristics
or discriminate classes. In this sense, the interest for selection of variables
of high importance for model construction, is constantly increasing. Following
this idea, the OPS [2] (Ordered Predictor Selection) algorithm for variable
selection seems to be a new alternative and a promissing means.The algorithm
consists of three steps: (1) obtaining an informative vector; (2) ordering
of the variables in decreasing manner by this vector; (3) investigation
of the ordered variables. The aim of this work is to show potentials of
the OPS algorithm for variable selection in discriminant analyses.
Experimental
In this work, 14 samples of brazilian commercial coffees
of the same trademark were used, seven of them being extra strong and the
other seven traditional coffees. The analytical technique used was solid
phase microextraction (SPME) [3]. Each sample was analyzed in triplicate.
The chromatographic data were organized into a matrix X(42x7500).
The COW algorithm [4] was used for alignment for chromatograms. The algorithm
of Kennard and Stone [5] was used for selection of 10 samples for prediction.
Results and Discussion
Calibration model without variable selection and with
3 latent variables (LVs) had standard error of crossvalidation (RMSECV)
equal to 0.2098 and correlation coefficient of crossvalidation (rcv)
equal to 0,932. Two samples were classified incorrectly in crossvalidation.
Two more samples were misclassified in prediction. When using the OPS algorithm,
800 of 7500 were selected. The calibration model with 3 LVs had RMSECV
= 0.1288 and rcv = 0.986. In this model,
both in calibration and prediction, all the samples were classified correctly.
Conclusions
Analyzing the obtained results for both models, it becomes
clear that the data treatment by the OPS algorithm for variable selection
yielded better results. Other data, when treated with the same methodology,
also showed excellent results.
Acknowledgements
To Capes and CNPq for financial support.
____________________________
[1] Barker, M., Rayens, W., J. Chemometr., 17
(2003)
166.
[2] Teófilo, R., et al., 10th Internat.
Conf. Chemometr. Anal. Chem. (2006).
[3] Bicchi, C., et al., J. Agric. Food Chem.,
50 (2002) 449.
[4] Nielsen, N. P. V., et al., J. Chromatogr.
A, 805 (1998) 17.
[5] Kennard, R. W., Stone, L. A., Technometrics,
11 (1969) 137.
14º Encontro Nacinal de Química Analítica