Close Window

Abstract ID: 466

Integração de Bancos de Dados do PPBio Amazônia na Arquitetura SpeciesLink

Considerando o propósito de integração de dados e definição de componentes geográficos para dados legados de coleções biológicas, os dados de biodiversidade apresentam uma complexidade que compreende o modelo de informação, os requisitos para o gerenciamento eficiente de dados e metadados, métodos de implementação de sistemas de banco de dados com capacidade analítica, armazenamento seguro, fragmentação e distribuição de dados no ambiente institucional. Neste contexto, é necessário garantir a adoção de tecnologias computacionais escaláveis, atentando sempre em permitir disseminação com segurança e estimular o uso de tecnologias livres. Este artigo apresenta uma arquitetura implementada para gestão de dados no Projeto de Pesquisa em Biodiversidade (PPBio) Amazônia objetivando o gerenciamento e disseminação de informações sobre a biodiversidade. A solução considerou requisito de integração de diferentes bases de dados de coleções biológicas, através de um integrador de banco de dados heterogêneos e distribuídos, o SpeciesLink, desenvolvido pelo Centro de Referência em Informação Ambiental (CRIA). Esse acesso é realizado através de um protocolo de comunicação Distributed Generic Information Retrieval (DiGIR) que promove a integração de bancos de dados em diferentes plataformas computacionais. É um protocolo cliente/servidor projetado para recuperar informação de fontes distribuídas, sendo configurável, uma vez que as redes que o utilizam podem escolher e definir esquemas conceituais de dados. Extração dos dados é realizado pelo aplicativo spLinker que tem o objetivo de espelhar em servidores regionais os dados das coleções biológicas. Para compor uma arquitetura ainda mais abrangente e que atenda também as necessidades do INPA, foram implementados bancos de dados de coleções biológicas de invertebrados, mamíferos e imagens. A arquitetura está preparado para permitir no futuro o conceito e a estrutura para o speciesLink Amazônia. Após análise dos dados de coleçoes, as descrições foram mapeados em Diagramas Entidade-Relacionamento (DER), e esses para um sistema de bancos relacional de dados em um Sistema Gerenciador de Banco de Dados (SGBD) e organizado as páginas Web via CSS (Cascading Style Sheets). Os bancos de dados gerenciam atributos de diferentes coleções biológicas, embora os dados originais dessas coleções foram migrados de diferentes formatos para a nova estrutura do banco de dados. A arquitetura adotada apresenta vantagens, pois permite escalabilidade de tecnologia e proporciona mecanismos adicionais que auxiliam a digitalização de coleções oferecendo funcionalidades de acesso via Web.

Session:  Biodiversity - Data/metadata integration and information dissemination: PPBio challenges and solutions.

Presentation Type:  Poster

Close Window