50.
Ferreira M. M. C., “Multivariate QSAR”. J. Braz. Chem. Soc., 13(6), 742-753 (Nov-Dec 2002).
[Special issue dedicated to 1st Brazilian Medicinal Chemistry Symposium - BrazMedChem, held in Caxambu, MG, Brazil on 11-16 November 2001, with oral contributions from this meeting. See Notes and Notes2.]
[Review.]
 

Abstract.
In this work, the chemometric techniques most frequently used in QSAR (quantitative structure-activity relationships) studies are reviewed. They are introduces in chronological order, beginning with Hansch analysis and the exploratory data analysis methods of principal components and hierarchical clustering (PCA and HCA). Principal component regression and partial least squares regression methods (PCR and PLS) are discussed, followed by the pattern recognition methods (KNN and SIMCA). Different applications are presented to illustrate these chemometric techniques. The methodology used for regression in 3D-QSAR is presented (unfolding PLS). Finally, the higher order method called Multilinear PLS, already used in analytical chemistry but not yet explored by the QSAR community, is introduced. This method maintains the multiway structure of the data and has several advantages over bilinear PLS including speed in calculation, simplicity and stability, since the number of parameters to be estimated can be greatly reduced.
 

Keywords.
Chemometrics; Principal Component Analysis; Partial Least Squares; SIMCA; KNN.

Keywords Plus.
Molecular Field Analysis; Multiway Calibration; 3D QSAR; Tutorial, 3D-QSAR; Binding; GOLPE; COMFA;
PLS.



Português

Resumo.
Neste trabalho, são apresentadas as técnicas usuais de quimiometria em estudos de relações quantitativas estrutura-atividade biológica (QSAR). Elas são introduzidas em ordem cronológica, iniciando pela análise de Hansch, e os métodos de análise exploratória de componentes principais e agrupamento hierárquico (PCA e HCA). Os métodos de regressão que usam a análise de componentes principais como fundamento (PCR e PLS) são apresentados a sequir. São introduzidos também os dois métodos de reconhecimento de padrões usados para classificação (KNN e SIMCA). Diferentes aplicações são usadas para ilustrar os diferentes métodos quimiométricos. É feito então um resumo da metodologia de regressão usada em QSAR-3D. Finalmente é apresentada uma nova metodologia, denominada PLS multilinear, já utilizada em química analítica, mas não explorada ainda pela comunidade de QSAR. Este método de regressão mantém a estrutura de ordem superior dos dados em lugar do desdobramento utilizado em QSAR-3D e apresenta vantagens computacionais, maior estabilidade e simplicidade do modelo, uma vez que o número de parâmetros calculados é bastante reduzido.
 

Palavras-chave.
Quimiometria; Análise de Componentes Principais; Quadrados Mínimos Parciais; SIMCA; KNN.

Palavras-chave Plus.
Análise de Campos Moleculares; Calibração Multivariada; QSAR 3D ; QSAR-3D, Tutorial; Ligação; GOLPE; COMFA;
PLS.