Ribeiro F. A. L., Pereira F. E. R., Ferreira M.M.C., "Utilização de análise de componentes principais na visualização de dados ambientais: Um estudo de caso" ["Use of principal component analysis in visualization of ambiental data: a case study"]. Poços de Caldas, MG, 23-26/05/2000: 23a Reunião Anual da Sociedade Brasileira de Química: A Ligação Química Brasil/Portugal [23rd Annual Meeting of the Brazilian Chemical Society: The Chemical Bond Brazil/Portugal], Livro de Resumos [Book of Abstracts], 3 (2000) AB-066. Poster AB-066.
UTILIZAÇÃO
DE ANÁLISE DE COMPONENTES PRINCIPAIS NA
VISUALIZAÇÃO
DE DADOS AMBIENTAIS: UM ESTUDO DE CASO
Fabiana
Alves de Lima Ribeiro (PG)1,
Edenir Rodrigues Pereira-Filho (PG)2,
Márcia
M. C. Ferreira (PQ)1
Departamentos
de Físico-Química1
e Química Analítica2
- Instituto de Química,
UNICAMP,
C. P. 6154, CEP 13083-970, Campinas, SP, Brasil
palavras-chave: PCA, Hidrocarbonetos Policíclicos Aromáticos, Química Ambiental
O estudo e interpretação dos resultados
de um determinado conjunto de
dados muitas vezes envolve
a análise de uma infinidade de variáveis,
constituíndo-
se desta forma um
trabalho que, além de complicado e demorado, é
suscetível a
intepretações
errôneas e a perdas de informações
relevantes. Desta forma, o
emprego de métodos
multivariados, tais como a Análise de Componentes Principais
(PCA), destaca-se
como uma importante ferramenta para
o tratamento de um
grande número de
dados, principalmente os provenientes de Química Ambiental
[1,
2].
Neste trabalho foi aplicado PCA para estudar um conjunto de
dados relativos
aos teores de
Hidrocarbonetos Policíclicos Aromáticos (PAHs),
determinados em
amostras de
sedimentos marinhos a diferentes níveis
de profundidades. Esses
resultados foram extraídos
de um trabalho encontrado na literatura [3],
onde os
autores determinaram
38 PAHs, tais como Naftaleno, Antraceno,
Dibenzotiofeno,
entre outros, em duas baías
situadas no Alaska-USA. A primeira região denominada
de Bay of Isles (BOI), sofreu
o impacto do derramamento de petróleo (42 x 106
litros)
proveniente do petroleiro
Exxon Valdez que provocou um grande desastre ambiental
em Março 1989,
e Drier Bay (DB), menos antigida pelo derramamento, foi
utilizada
como baía
de referência para comparar os teores
de PAHs, uma vez que esta
região apresenta
outras fontes destes compostos além
do óleo proveniente do
derramamento.
A amostragem do sedimento foi feita em três
níveis de profundidades para
cada baía:
a primeira mais superficial, perto da costa (10-50 m),
uma intermediária
(50-100 m) e
uma terceira mais profunda e mais distante
da linha costeira (100-
150 m). Os autores empregaram
amostras certificadas de referência para determinar
a exatidão
das determinações. As amostragens
foram executadas de forma
aleatória em 12 estações,
sendo 7 em DB e 5 em BOI.
Uma das dificuldades na avaliação do impacto do derramamento
encontra-se
justamente no
fato de que a região
possui numerosas fontes naturais
e
antropogênicas
de hidrocarbonetos, que também
contaminaram o sedimento
marinho ao longo
do tempo. Desta forma os
autores agruparam os valores
determinados
dos 38 PAHs em 10 variáveis
mais relevantes que fornecem
informações
sobre o petróleo proveniente de processos
biológicos, queima de
combustíveis ou derramamento,
gerando assim uma matriz de dados composta por
82 amostras (40 BOI e 42
DB) e 10 variáveis.
Com a aplicação da PCA (dados autoescalados) foi possível
notar uma nítida
separação
entre as amostras referentes e cada uma das duas baías,
conforme a
figura 1a, formando
2 agrupamentos distintos. Ainda, utilizando PCA
foi possível
detectar a origem dos grupos
de hidrocarbonetos relacionados à cada baía, onde a
variável D2/P2
(relação Dibenzotiofeno/Fenantreno) diretamente
interligada ao
derramamento caracteriza
a Bay of Isles e as variáveis PER (processos biológicos)
e PYRO (queima de
combustíveis fósseis) estão ligadas a Drier
Bay (figura 2b). A
figura 2c, onde
os dados foram classificados segundo a profundidade, mostra
que
as amostras
de sedimentos provenientes de 10-50
m apresentam uma maior
contaminação
quando comparada com as outras faixas.
Figura 1: Gráficos dos
Scores e Loading onde pode ser visualizada
a separação entre as
amostras provenientes das
duas baías estudadas (a): variáveis
que contribuem para estas
separações (b)
e separação da faixa de 10-50 m das
demais profundidades (c).
Com o emprego da Análise de Componentes
Principais a visualização de
diversas variáveis
em um determinado conjunto de dados torna-se mais
produtiva,
rápida, objetiva
e eficiente. Neste sentido, a união
da Química Ambiental com a
Quimiometria, apresenta
uma sinergia, onde a interpretação de uma grande série
de
dados adquiri uma maior
qualidade nas informações geradas, abrindo espaço
para
novos estudos.
[1] M.M.C. Ferreira, C.G.
Faria, E.T. Paes, Chemom. Intell. Lab. Syst., 47, 1999, 289.
[2] S. Wold, K. Esbensen,
P. Geladi, Chemom. Intell. Lab. Syst., 2, 1987, 37.
[3] P. D. Boehm,
D. S. Page, E. S. Gilfillan,
A. E. Bence, W. A. Burns, P.
J.
Mankiewicz, Environ.
Sci. Technol., 32, 1998, 567.
CAPES,
FAPESP
USE
OF PRINCIPAL COMPONENT ANALYS IN VISUALIZATION
OF
AMBIENTAL DATA: A CASE STUDY
Fabiana
Alves de Lima Ribeiro (PG)1,
Edenir Rodrigues Pereira-Filho (PG)2,
Márcia
M. C. Ferreira (PQ)1
Departamentos
de Físico-Química1
e Química Analítica2
- Instituto de Química,
UNICAMP,
C. P. 6154, CEP 13083-970, Campinas, SP, Brasil
key-words: PCA, Polycyclic Aromatic Hydrocarbons, Environmental Chemistry
Study and interpretation of data analysis results includes
many times a large
number of variables
and thus, becoming a complicated and
time-consuming work,
very sensitive
to wrong interpretations and loss of
relevant information. Therefore,
the use of multivariate
methods such as Principal Component Analysis (PCA) is
very
important in treatment
of a large number of data such as data
from Environmental
Chemistry [1,2].
Iin this work, PCA was used in study of data for contents of Polycyclic
Aromatic
Hydrocarbons (PAHs),
determined in samples of marine sediments
from different
depths. These
results were extracted from a literature work [3], where
the authors
had determined 38 PAHs such
as naphthalene, anthracene, dibenzothiophene among
others, as found in
two bays in Alaska-US. One region is called Bay
of Isles (BOI),
which was affected
by a petroleum loss (42 x 106
liters) from a petrol carrier ship
Exxon Valdez, what
led to a great environmental disaster in March 1989.
The other
bay is Drier Bay
(DB), which was less affected, and it
was used as the reference
bay in PAHs
contents comparison because there
are other sources for these
compounds besides the mentioned
disaster.
Sediment sampling was carried out three depths
in each bay: the first one
superficial and
close to the coast (10-50 m), the other one
intermedia (50-100 m),
and the third depth and
farther from the coastal line (100-150 m). The
authors used
standard samples to determine
the quality of the determinations. The sampling
was
carried out arbitrarily
at 12 stations, from which 7 were in DB and 5 in BOI.
One of the difficulties in evaluation of the disaster
impact was due to the fact
that the region
had several natural and anthropogenic
sources of hydrocarbons
which, during a long time
had also contaminated the marine sediments. Because
of
this, the authors
groupped the determinations for 38 PAHs into
10 most relevant
variables which
contained information about petroleum from
biological processes,
combustion and disasters.
They generated a data matrix for 82 samples (40
for BOI
and 42 for DB) and
10 variables.
Whe using PCA on autocaled data, it
was possible to observed a clear
separation between
the reference samples and the samples
from each bay, as
shown in Figure 1a where
are two distinct groups. Besides that, PCA has
detected
the origin of the groups
of hydrocarbons from each bay: the variable D2/P2 (relation
dibenzothiophene/phenanthrene)
is directly related to the disaster in Bay
of Isles,
whilst the variable PER
(biological processes) and PYRO (combustion of fossil fuels)
are related
to Drier Bay (Figure 2b). Figure 2c
with data classified according to
depths shows that the sediment
samples from 10-50 m are more contaminated than
the ther samples.
Figure 1: Scores and loadings plots showing
the separation between samples from the two bays
under study (a): variables which contribute
to this separation (b) and separation for 10-50 m depth
and other depth values (c).
Using Principal Component Analsys in visualization of
diverse variables of
a studied dat set is a very
productive, rapid, objective and efficient approach. In this
sense, Environmental Chemistry
together with Chemometrics is a combination which
is able to intepret a large
series of data and produce useful information which can be
used in further studies.
[1] M.M.C. Ferreira, C.G.
Faria, E.T. Paes, Chemom. Intell. Lab. Syst., 47, 1999, 289.
[2] S. Wold, K. Esbensen,
P. Geladi, Chemom. Intell. Lab. Syst., 2, 1987, 37.
[3] P. D. Boehm,
D. S. Page, E. S. Gilfillan,
A. E. Bence, W. A. Burns, P.
J.
Mankiewicz, Environ.
Sci. Technol., 32, 1998, 567.
CAPES,
FAPESP