terça-feira, 3 de maio de 2011

Computação fornece importantes ferramentas para pesquisa moderna


No interior do auditório, o espectador flutua numa floresta de sequoias com a limpidez do Imax, numa enorme tela no teto. A sensação de pairar se transforma em vertigem quando a câmera mergulha mais profundamente na floresta, se aproxima do galho de uma sequoia gigante e mergulha no interior de uma folha, chegando até uma célula individual.

Dentro da célula, a cena evoca o filme de ficção científica "Viagem Fantástica" - em que humanos liliputianos, dentro de uma minúscula cápsula, realizam uma jornada médica pelo corpo humano. Mas há uma importante diferença. "Life: A Cosmic Journey" ("vida: uma jornada cósmica", em tradução livre), apresentação multimídia sendo exibida no novo Planetário Morrison, na Academia de Ciências da Califórnia, não se baseia apenas em técnicas de computação gráfica, mas também numa fartura de dados científicos digitalizados.

A exibição no planetário é uma demonstração visualmente espetacular da forma como a computação vem transformando as ciências, fornecendo ferramentas tão importantes à pesquisa moderna quanto o microscópio e o telescópio foram aos cientistas do passado. Seu uso acompanha uma mudança fundamental no material estudado pelos cientistas. Espécimes individuais - fósseis, organismos vivos ou células - já foram o substrato da descoberta. Hoje, numa extensão ainda mais ampla, pesquisadores trabalham com imensas coleções de dados digitais, e o domínio dessas montanhas de informações depende da computação.

A tecnologia física da pesquisa científica continua viva - os novos microscópios eletrônicos, telescópios, colisores de partículas -, mas já é inseparável da computação. São os computadores que ajudam o cientista a encontrar ordem e padrão nas informações brutas coletadas pelas ferramentas físicas. A computação não serve apenas como apoio, mas define a própria natureza da pesquisa: o que pode ser estudado, quais perguntas podem ser feitas e respondidas.

"O mais profundo é que, atualmente, todos os instrumentos científicos possuem alguma inteligência computacional em seu interior, e isso é uma enorme mudança", disse Larry Smarr, astrofísico e diretor do Instituto de Telecomunicações e Tecnologia da Informação da Califórnia, ou Calit2, consórcio de pesquisa da Universidade da Califórnia, em San Diego.

Na primeira produção do planetário, "Fragile Planet" (planeta frágil, em inglês), o espectador era transportado pelo telhado do Morrison, parecendo voar num gracioso arco ao redor do museu projetado por Renzo Piano, então subindo rapidamente ao sistema solar para explorar o cosmos. Onde imagens visuais eram projetadas na cúpula do primeiro Planetário Morrison por um elaborado projetor de estrelas, a nova projeção é alimentada por três sistemas de computação distintos e paralelos. São tantos dados armazenados que o sistema é, ao mesmo tempo, telescópio e microscópio. De inexplicavelmente pequeno a inimaginavelmente grande, o planetário computadorizado se move impecavelmente por 12 ordens de magnitude nos objetos que apresenta. Ele pode pular "do subatômico à estrutura do universo em grande escala", afirmou Ryan Wyatt, astrônomo que dirige o planetário.

Segundo Katy Borner, cientista da computação da Universidade de Indiana especializada em visualização científica, o sistema é um "macroscópio". Ela usa a palavra para descrever uma nova classe de instrumentos científicos computadorizados, onde se enquadra a nova máquina física e virtual do planetário. São ferramentas combinadas, com diferentes tipos de presenças físicas. Seus programas são tão poderosos e flexíveis que se tornam uma bancada científica completa, podendo ser reconfigurada pela mistura e combinação de aspectos do software para abordar problemas específicos de pesquisa.

O macroscópio do planetário foi criado para a educação, mas poderia ser usado para pesquisa. Como qualquer macroscópio, sua essência é a capacidade de abordar bancos de dados gigantescos de diversas maneiras. "Macroscópios oferecem uma visão geral", escreveu Borner na edição de março de "The Communications of the Association for Computing Machinery", "ajudando-nos a sintetizar os elementos relacionados e identificar padrões e tendências, ao mesmo tempo em que concede acesso a inúmeros detalhes". Segundo ela, os instrumentos científicos baseados em softwares estão possibilitando a descoberta de fenômenos e processos que, no passado, "foram grandes, lentos ou complexos demais para que o a mente humana conseguisse perceber e compreender".

A computação está reformulando a pesquisa científica de diversas maneiras, aponta Borner. Por exemplo, cientistas independentes têm dado cada vez mais preferência a equipes citadas em artigos da física de partículas que possuem centenas - e até milhares - de autores. Isso é de certa forma previsível, já que a internet foi inventada como ferramenta de colaboração para a comunidade da física de partículas no CERN, o laboratório europeu de pesquisa nuclear, no início da década de 1990. Como resultado, equipes de pesquisa em todas as disciplinas científicas estão se tornando interdisciplinares e amplamente distribuídas do ponto de vista geográfico.

Os softwares chamados de Web 2.0, com sua vinculação direta de aplicativos, tornaram mais fácil compartilhar descobertas de pesquisa. Isso, por sua vez, levou a uma explosão de esforços colaborativos. Isso também aumentou o alcance de projetos interdisciplinares, já que está mais fácil adaptar e combinar técnicas baseadas em software - de ferramentas analíticas a utilitários para exportar e importar dados.

Um macroscópio não precisa estar numa única localização física. Para dar um exemplo, um visitante no laboratório de Tom DeFanti, especializado em computação gráfica e montado no prédio do Calit2, em San Diego, é recebido por uma enorme parede de telas. As telas parecem oferecer uma janela, em alta resolução, para um laboratório desocupado em algum outro lugar do mundo. A sala distante é um laboratório paralelo da King Abdullah University of Science and Technology, em Thuwal, Arábia Saudita. Há quatro anos, representantes dessa universidade visitaram o Calit2 e iniciaram uma colaboração, pela qual os cientistas dos EUA ajudaram a criar um centro paralelo de visualização científica em Thuwal, conectado à internet em até 10 gigabits de banda, o suficiente para compartilhar imagens e pesquisas em alta resolução.

Hoje, pesquisadores sauditas têm acesso a um sistema de software conhecido como SAGE (sigla em inglês para Ambiente Gráfico Escalável Adaptativo), desenvolvido originalmente para permitir que cientistas fisicamente distantes possam compartilhar e visualizar dados de pesquisa. O SAGE é basicamente um sistema operacional para informações visuais, capaz de exibir e manipular imagens com até um terço de um bilhão de pixels - ou 150 vezes mais do que pode ser exibido numa tela comum de computador.

"O aplicativo definitivo, ou 'killer app', é a colaboração. É isso que as pessoas querem", disse DeFanti. "A energia que você economiza deixando de voar até Londres pode alimentar um conjunto de computadores por um ano". Mais de uma década atrás, Smarr começou a construir uma funcionalidade de supercomputação distribuída que ele chamou de OptIPuter. Ela usava as conexões de fibra ótica entre os supercomputadores do país para possibilitar a divisão de problemas de computação, além de dados digitais. Assim, cargas computacionais científicas maiores poderiam ser compartilhadas.

Segundo ele, porém, o advento de sistemas de computação de alta performance criou um novo gargalo para os cientistas. "Durante a década passada, os computadores ficaram mil vezes mais rápidos devido à lei de Moore e a habilidade de armazenar informações aumentou cerca de 10 mil vezes - enquanto o número de pixels que conseguimos exibir talvez tenha crescido apenas num fator de dois", disse. Para fazer com que a visualização alcance a capacidade de computação, pesquisadores do Calit2 - e outros - começaram a projetar sistemas de exibição chamados OptIPortals, que oferecem melhores maneiras de representar dados científicos.

Recentemente, os pesquisadores do Calit2 iniciaram a construção de versões em menor escala, chamadas OptIPortables, sistemas de exibição menores que podem ser montados como blocos de Lego, partindo de apenas um punhado de monitores, em vez de centenas. Os monitores OptIPortable podem ser montados e transportados com facilidade, e DeFanti afirmou que seu laboratório está trabalhando em capacidade máxima na montagem de sistemas para grupos de pesquisa do mundo todo. Em muitos campos científicos, instrumentos baseados em software vêm agregando cada vez mais funções, à medida que sistemas de código aberto possibilitam que pequenos grupos - ou mesmo indivíduos - acrescentem recursos para permitir personalizações.

O Cytoscape é um conjunto de softwares de bioinformática que evoluiu desde sua criação, em 2001, através de pesquisas no laboratório de Leroy Hood, na Universidade de Washington. Hood, um dos fundadores do Instituto de Biologia de Sistemas, em Seattle, foi um pioneiro no campo do sequenciamento automatizado de genes. Um de seus alunos de graduação da época, Trey Ideker, explorava a possibilidade de automatizar o mapeamento das interações de genes.

Para uma tarefa tão complexa quanto o sequenciamento de genes, mapear todas as interações possíveis entre os estimados 30 mil genes que compõem o cromossomo humano é ainda mais complexo. Isso levou ao surgimento do campo da biologia de rede, à medida que biólogos começaram a construir modelos computacionais de processos celulares e de doenças.

"Logo percebemos que não éramos os únicos enfrentando esse problema e que outras pessoas estavam criando ferramentas em software de forma independente", disse Ideker. Os pesquisadores decidiram assumir o que na época era um grande risco, e começaram a desenvolver seu código como um projeto de software com código aberto - significando que ele poderia ser livremente compartilhado por toda a comunidade biológica. O projeto ganhou força quando Ideker, atualmente diretor de genética na Escola de Medicina UCSD, uniu esforços com Gary Bader, biólogo que hoje comanda um laboratório de biologia computacional na Universidade de Toronto.

O projeto ganhou mais colaboradores na década passada, à medida que outros pesquisadores decidiam contribuir com ele em vez de criar ferramentas independentes. Para fortalecer ainda mais o projeto, o software foi desenvolvido de forma que novos módulos poderiam ser agregados por pesquisadores independentes que quisessem adaptá-lo para tarefas específicas.

"Nós permitimos, a partir de 2001, o que chamávamos de 'plug-ins' - hoje em dia, com o sucesso da Apple, eles seriam chamados de aplicativos, ou 'apps'", explicou ele. "Existem cerca de duas centenas de aplicativos disponíveis para o Cytoscape". O projeto é atualmente mantido com uma bolsa de US$ 6,5 milhões do Instituto Nacional de Ciências Médicas Gerais, do Instituto Nacional de Saúde.

Ferramentas como o Cytoscape possuem uma relação simbiótica com bancos de dados imensos, que cresceram para dar suporte às atividades de pesquisa que estudam campos mais novos, como genômica e proteômica. O sequenciamento de genes levou à criação do Genbank, atualmente mantido pelo Centro Nacional de Informações em Biotecnologia. E com um fluxo cada vez maior de dados digitais, outros bancos de dados vêm sendo criados - na Europa, por exemplo, no Instituto Europeu de Bioinformática, que começou a construir um conjunto de novos bancos de dados para funções como interações entre proteínas. O Cytoscape ajuda a transformar os bancos de dados distintos num total federado, usando plug-ins que permitem que um cientista escolha e procure em fontes variadas.

Para Borner, cientista da computação da Universidade de Indiana, o Cytoscape é um modelo poderoso, baseado no mecanismo de compartilhamento que é a base da internet. A ideia, segundo ela, foi inspirada no testemunho da força e do impacto presentes no compartilhamento inerente de serviços da web, como Flickr e YouTube. Além disso, existe o potencial de ser rapidamente replicado em muitas disciplinas diferentes. "Agora você também pode compartilhar algoritmos de plug-ins", afirmou ela.

"Você pode criar sua própria biblioteca simplesmente adicionando seus algoritmos favoritos à ferramenta".

Fonte: The New York Times
Postar um comentário