O professor Marcos Buckeridge vislumbra que a abordagem em redes vai mudar a forma como as pessoas enxergam o mundo
Uma das estratégias usadas para estudar o funcionamento de um sistema biológico é através da representação sob a forma de uma rede composta de diversas variáveis interligadas. Desse modo, é possível comparar, por exemplo, um tecido sadio e um doente, descobrir o que há de diferente nessas duas redes e em quais variáveis é recomendável intervir para restabelecer o equilíbrio do sistema. Por meio de um projeto apoiado pela Fapesp – Fundação de Amparo à Pesquisa do Estado de São Paulo – e pela Microsoft Research, pesquisadores da USP desenvolveram o software BioNetStat, que permite analisar mais de duas redes complexas ao mesmo tempo e determinar padrões de relevância biológica. A ferramenta pode ter aplicações variadas que vão muito além das ciências biológicas. O Jornal da USP no Ar conversa com o coordenador do projeto, professor Marcos Buckeridge, diretor do Instituto de Biociências (IB) da USP.
A forma empregada usualmente para a abordagem do mundo é a cartesiana. Ou seja, ao dispor de uma variável, ela é inserida em um sistema de coordenadas com dois eixos, o das abscissas (eixo x) e das ordenadas (eixo y). Assim, é possível observar, por exemplo, como determinado mercado variou em função do tempo. É dessa maneira que, normalmente, os gráficos dos jornais e programas de televisão são construídos; em outras palavras, estamos habituados com essa abordagem.
“O grande problema é a interpretação”, comenta Buckeridge sobre a abordagem cartesiana, e avança: “Não podemos achar que apenas uma variável pode alterar todo um sistema”. O professor reforça a complexidade dos sistemas como o corpo humano, as cidades, o planeta e o Universo em si. “Uma variável pode ser importante para determinar o comportamento de um sistema. No entanto, sabemos agora que são diversas variáveis em conjunto que determinam, de fato, um sistema.”
O projeto nasce justamente para desenvolver uma forma diferente de abordar o mundo, que considere múltiplas variáveis. A Fapesp, em parceria com a Microsoft Research, financiará diversos projetos com o intuito de mesclar computação, biologia e outras áreas. O BioNetStat permite cruzar um conjunto de variáveis em rede, a fim de determinar quais são as mais importantes, como as chamadas centralidades. O software também é livre, isso significa que pode ser executado, copiado, modificado e redistribuído gratuitamente. Buckeridge explica que seu uso é relativamente simples, mas pondera que o usuário precisa ter clareza e precisão nos dados.
Suas aplicações também são múltiplas. O professor lembra que o BioNetStat foi utilizado para analisar os diversos padrões existentes na cidade de São Paulo. Um estudo realizado pela USP já havia determinado que existem oito padrões de cidade. Com o software foi possível cruzar os diferentes padrões com as mais de 30 variáveis estruturais de São Paulo, inclusive, com a incrementação de dados estatísticos. Buckeridge diz que o mesmo pode ser feito com o cérebro, a fim de determinar os genes mais importantes no desenvolvimento do câncer de cérebro.
“Em alguns anos teremos muito mais dessa abordagem em rede”, prevê o professor. Através do BioNetStat, o médico pode cruzar informações do prontuário, obtendo maior previsibilidade de enfermidades futuras. O mesmo processo poderá ser empregado para a compreensão e prevenção de epidemias.
O uso de dados e cruzamentos de múltiplas variáveis não é algo inédito. Buckeridge relembra o caso da Cambridge Analytica, empresa de mineração de dados complexos, que se envolveu em escândalos sobre a suspeita de influenciar o resultado das eleições estadunidenses em 2016. Apesar de inúmeros benefícios, essa nova abordagem do mundo traz consigo novos dilemas éticos. Para o professor, o que neutraliza o mal uso dos dados é o conhecimento. A sociedade deve empoderar-se com o conhecimento, ficar mais atenta para o funcionamento dessas ferramentas.