71.

Ribeiro F. A. L., Pereira F. E. R., Ferreira M.M.C., "Utilização de análise de componentes principais na visualização de dados ambientais: Um estudo de caso" ["Use of principal component analysis in visualization of ambiental data: a case study"]. Poços de Caldas, MG, 23-26/05/2000: 23a Reunião Anual da Sociedade Brasileira de Química: A Ligação Química Brasil/Portugal [23rd Annual Meeting of the Brazilian Chemical Society: The Chemical Bond Brazil/Portugal], Livro de Resumos [Book of Abstracts], 3 (2000)  AB-066. Poster AB-066.


Português
AB-066

UTILIZAÇÃO DE ANÁLISE DE COMPONENTES PRINCIPAIS NA
VISUALIZAÇÃO DE DADOS AMBIENTAIS: UM ESTUDO DE CASO

Fabiana Alves de Lima Ribeiro (PG)1, Edenir Rodrigues Pereira-Filho (PG)2,
Márcia M. C. Ferreira (PQ)1
Departamentos de Físico-Química1 e Química Analítica2 - Instituto de Química,
UNICAMP, C. P. 6154, CEP 13083-970, Campinas, SP, Brasil

palavras-chave: PCA, Hidrocarbonetos Policíclicos Aromáticos, Química Ambiental

           O estudo  e  interpretação  dos  resultados  de  um  determinado  conjunto  de
dados muitas vezes envolve  a  análise de uma infinidade  de variáveis,  constituíndo-
se desta forma  um  trabalho que,  além  de complicado e demorado,  é  suscetível  a
intepretações   errôneas  e  a  perdas  de  informações  relevantes.   Desta  forma,  o
emprego de métodos multivariados,  tais como a  Análise de Componentes Principais
(PCA),  destaca-se  como  uma   importante   ferramenta  para  o  tratamento  de  um
grande número de dados, principalmente os provenientes  de  Química Ambiental  [1,
2].
           Neste trabalho foi aplicado  PCA  para estudar um conjunto de dados relativos
aos  teores  de  Hidrocarbonetos  Policíclicos Aromáticos  (PAHs),  determinados  em
amostras  de  sedimentos  marinhos  a  diferentes  níveis  de  profundidades.   Esses
resultados foram  extraídos  de  um  trabalho  encontrado  na  literatura [3],  onde  os
autores  determinaram  38  PAHs,  tais  como  Naftaleno,  Antraceno,  Dibenzotiofeno,
entre outros, em duas baías situadas no Alaska-USA.  A  primeira região denominada
de Bay of Isles (BOI), sofreu o impacto do derramamento de petróleo  (42 x 106 litros)
proveniente do petroleiro Exxon Valdez  que provocou um grande desastre ambiental
em Março 1989,  e  Drier Bay  (DB), menos antigida pelo derramamento,  foi utilizada
como  baía  de  referência  para  comparar  os  teores  de  PAHs,  uma  vez  que esta
região  apresenta  outras  fontes  destes  compostos  além  do  óleo  proveniente  do
derramamento.
           A amostragem  do  sedimento foi  feita  em três níveis  de  profundidades para
cada baía:  a primeira mais superficial,  perto da costa  (10-50 m),  uma intermediária
(50-100 m)  e  uma  terceira mais  profunda  e  mais distante  da  linha costeira  (100-
150 m). Os autores empregaram amostras certificadas de referência para determinar
a  exatidão  das  determinações.    As  amostragens   foram   executadas   de   forma
aleatória em 12 estações,  sendo 7 em DB e 5 em BOI.
           Uma das dificuldades na  avaliação do impacto do derramamento encontra-se
justamente   no   fato   de   que   a   região   possui   numerosas   fontes   naturais  e
antropogênicas  de   hidrocarbonetos,   que   também   contaminaram   o  sedimento
marinho  ao  longo  do  tempo.   Desta  forma   os   autores   agruparam   os  valores
determinados   dos   38  PAHs  em  10  variáveis   mais   relevantes   que   fornecem
informações  sobre  o  petróleo  proveniente  de  processos  biológicos,  queima   de
combustíveis ou derramamento,  gerando assim uma matriz  de dados composta  por
82 amostras (40 BOI e 42 DB) e 10 variáveis.
           Com a aplicação da PCA (dados autoescalados) foi possível notar uma nítida
separação  entre  as  amostras referentes  e cada uma das duas baías,  conforme a
figura 1a,  formando  2  agrupamentos  distintos.  Ainda,  utilizando PCA foi possível
detectar a origem dos grupos de hidrocarbonetos relacionados à cada baía,  onde a
variável  D2/P2  (relação  Dibenzotiofeno/Fenantreno)   diretamente   interligada   ao
derramamento caracteriza a Bay of Isles e as variáveis  PER  (processos biológicos)
e PYRO  (queima de combustíveis fósseis)  estão ligadas a Drier Bay  (figura 2b).  A
figura 2c,  onde  os  dados foram classificados segundo a profundidade,  mostra que
as  amostras  de  sedimentos  provenientes   de  10-50  m   apresentam  uma   maior
contaminação quando comparada com as outras faixas.


Figura 1: Gráficos  dos  Scores  e  Loading  onde  pode  ser visualizada   a  separação  entre  as
amostras  provenientes  das  duas  baías  estudadas  (a):  variáveis  que  contribuem  para estas
separações  (b)  e  separação da faixa de  10-50 m  das  demais profundidades (c).
 

           Com  o emprego  da  Análise  de Componentes Principais  a  visualização  de
diversas variáveis em  um  determinado conjunto  de dados  torna-se mais produtiva,
rápida, objetiva e eficiente.  Neste sentido,  a   união  da  Química Ambiental  com  a
Quimiometria, apresenta uma sinergia, onde a interpretação de uma grande série de
dados adquiri uma maior qualidade nas informações geradas,  abrindo espaço  para
novos estudos.
[1] M.M.C. Ferreira, C.G. Faria, E.T. Paes, Chemom. Intell. Lab. Syst., 47, 1999, 289.
[2] S. Wold, K. Esbensen, P. Geladi, Chemom. Intell. Lab. Syst., 2, 1987, 37.
[3] P.  D.  Boehm,  D.  S.  Page,  E.  S.  Gilfillan,   A.  E.  Bence,  W.  A.  Burns,   P. J.
Mankiewicz, Environ. Sci. Technol., 32, 1998, 567.
 CAPES, FAPESP


English
AB-066

USE OF PRINCIPAL COMPONENT ANALYS IN VISUALIZATION
OF AMBIENTAL DATA: A CASE STUDY

Fabiana Alves de Lima Ribeiro (PG)1, Edenir Rodrigues Pereira-Filho (PG)2,
Márcia M. C. Ferreira (PQ)1
Departamentos de Físico-Química1 e Química Analítica2 - Instituto de Química,
UNICAMP, C. P. 6154, CEP 13083-970, Campinas, SP, Brasil

key-words: PCA, Polycyclic Aromatic Hydrocarbons, Environmental Chemistry

           Study and interpretation of data analysis results  includes  many  times  a  large
number of variables  and  thus,  becoming  a  complicated  and  time-consuming  work,
very  sensitive  to  wrong  interpretations  and  loss  of  relevant information. Therefore,
the use of  multivariate methods such as  Principal Component Analysis  (PCA)  is very
important in treatment  of  a  large number  of  data such  as  data from  Environmental
Chemistry [1,2].
           Iin this work, PCA was used in study of data for contents of  Polycyclic Aromatic
Hydrocarbons  (PAHs),  determined  in  samples  of  marine  sediments  from  different
depths.  These  results were extracted from a literature  work  [3],  where  the  authors
had determined 38 PAHs such as naphthalene, anthracene, dibenzothiophene  among
others,  as found in  two bays  in  Alaska-US.  One  region is called Bay  of Isles  (BOI),
which was affected  by  a  petroleum  loss  (42 x 106 liters)  from  a  petrol  carrier  ship
Exxon Valdez,  what  led to  a great environmental  disaster  in March 1989.  The other
bay is  Drier Bay  (DB),  which  was less  affected,  and  it  was used  as the  reference
bay  in  PAHs  contents   comparison   because  there   are   other  sources   for  these
compounds besides the mentioned disaster.
           Sediment  sampling was carried  out  three  depths  in  each bay:  the  first  one
superficial  and  close  to  the coast  (10-50 m),  the other one  intermedia  (50-100 m),
and the third depth and farther  from the coastal line  (100-150 m).  The  authors  used
standard samples to determine the quality of  the  determinations.  The  sampling  was
carried out arbitrarily at 12 stations,  from which 7 were in DB and 5 in BOI.
           One of the  difficulties in evaluation of  the  disaster impact was  due to the fact
that the  region  had   several  natural  and  anthropogenic  sources  of  hydrocarbons
which, during a long time had also contaminated the marine  sediments.  Because   of
this,  the authors  groupped  the  determinations for  38  PAHs  into 10  most  relevant
variables  which  contained  information  about  petroleum  from  biological  processes,
combustion and disasters. They  generated a data matrix  for 82  samples  (40 for BOI
and 42 for DB)  and 10 variables.
           Whe using  PCA  on   autocaled data,   it  was  possible   to  observed  a  clear
separation  between   the  reference  samples  and   the  samples  from each bay,  as
shown in Figure 1a where are  two distinct groups.  Besides that,  PCA  has  detected
the origin of the groups of hydrocarbons from each bay:  the variable  D2/P2  (relation
dibenzothiophene/phenanthrene)  is  directly related  to  the disaster  in  Bay  of  Isles,
whilst the variable PER (biological processes)  and PYRO (combustion of fossil  fuels)
are  related  to  Drier Bay  (Figure 2b).   Figure  2c  with  data classified  according  to
depths shows that the sediment samples from  10-50  m are more contaminated  than
the ther samples.


Figure 1: Scores and loadings plots showing the separation between samples from  the  two bays
under study (a): variables which contribute to this separation (b) and separation for 10-50 m depth
and other depth values (c).
 

           Using Principal Component Analsys  in  visualization  of  diverse  variables  of
a studied dat set is a very productive,  rapid, objective and efficient approach.  In this
sense, Environmental Chemistry together with Chemometrics is a combination which
is able to intepret a large series of data and produce useful information which can be
used in further studies.
[1] M.M.C. Ferreira, C.G. Faria, E.T. Paes, Chemom. Intell. Lab. Syst., 47, 1999, 289.
[2] S. Wold, K. Esbensen, P. Geladi, Chemom. Intell. Lab. Syst., 2, 1987, 37.
[3] P.  D.  Boehm,  D.  S.  Page,  E.  S.  Gilfillan,   A.  E.  Bence,  W.  A.  Burns,   P. J.
Mankiewicz, Environ. Sci. Technol., 32, 1998, 567.
 CAPES, FAPESP