Fazendo Análise de Redes Sociais


2rede.jpgUma das coisas que diversas pessoas perguntam é como fazer análise de redes sociais e como montar grafos das redes. O grafo, além de bonitinho, é uma forma fácil de visualizar a rede e, muitas vezes, ver nós mais centrais ou mais conectados nela. Vou tentar explicar de uma forma rápida como eu tenho trabalhado.

1. Determinação da Rede a ser Analisada
A primeira coisa a ser feita é delimitar a rede que se vai analisar. É impossível analisar, por exemplo, todos os blogs do mundo. E como os blogs estão interconectados, é preciso impor um limite na rede. Em geral, eu opto por limitar pelos graus de separação. Suponhamos, por exemplo, que eu vá analisar a rede deste blog. Os blogs que estão no primeiro grau de separação são aqueles que estão diretamente linkados aqui. Aqueles que estão linkados nas pessoas que estão conectadas aqui, por exemplo, seriam o segundo grau de separação e assim por diante. Note-se que o aumento da rede é exponencial e que dificilmente se consegue fazer uma análise qualitativa de mais de um grau de separação. Além disso, é preciso determinar o que será considerado um nó (um blog? um fotolog? um usuário único?) e o que será considerado uma conexão (um comentário? um link?).

2. Coleta de Dados
Os dados podem ser coletados manualmente, se a rede for pequena ou de forma automática, se a rede analisada é grande demais. Em geral, eu faço a coleta manual com um grau de separação (às vezes, até dois se o primeiro grau forem poucos nós). Na época da minha tese, quando analisei mais de 300 mil fotologs, usei um crawler, que é um programinha que recolhe dados de forma automática. Esse que eu criei precisa ser atualizado, mas ainda pretendo usar para outra pesquisa. De um modo geral, o crawler vai precisar ser construído pelo pesquisador ou sob a sua supervisão, porque os dados que serão recolhidos vão ser selecionados por ele. O ideal é testar o programa de forma qualitativa antes - passando numa rede pequena que o pesquisador possa acompanhar para ver se ele funciona, por exemplo. Outro problema é que crawlers são demorados e muitos sites - como o Orkut, por exemplo - costumam deletar perfis que estejam crawleando o sistema. O ideal é ou pedir autoriazação para crawlear ou tentar fazê-lo de um modo que não comprometa o sistema (respeitando o número de pings por minuto, por exemplo). É claro que a coleta de dados pode levar dias e até semanas com o programa rodando no computador.

3. Análise dos Dados
Depende de que propriedades se quer analisar. Propriedades quantitativas, por exemplo, são geralmente extraídas com a ajuda de programas de análise. Eu já usei o Pajek para verificar coisas como centralidade, grau de intermediação e etc. Para desenhar a rede e extrair outros dados, como grau de cada nó, eu também já usei o NetDraw. Ambos só funcionam em Windows e estive catando, nos últimos dias, programas que auxiliem a análise dos dados para Mac. Encontrei dois multiplataformas que parecem promissores: o Tulip, que é bem legal (não tão completo quanto o Pajek, mas faz o básico) e o Guess, que é mais pobrezinho, mas mais estável. Aliás, estabilidade é um problema sério desse tipo de software. De um modo geral, a maioria dos programas não consegue lidar com uma grande quantidade de dados, travando. Isso exige uma paciência de monge para trabalhar com grandes quantidades de dados.

Já quem quer analisar só elementos qualitativos (por exemplo, investigar as motivações em uma rede determinada), por outro lado, não precisa de programas de análise, embora possa usar algum deles para ilustrar a rede analisada. Embora a análise de redes sociais tenha sido constituída, enquanto perspectiva de análise, de uma forma praticamente só quantitativa, do meu ponto de vista, é possível utilizá-la para análises qualitativas também. Análises qualitativas são ótimas para indicar elementos que depois podem ser verificados de forma mais ampla em uma quantitativa posterior.

Blogs legais para se observar dados e análises:
# O blog do Matthew Hurst que traz vários dados e análises, inclusive essa da blogosfera onde ele mostra um pouco uma análise a partir das imagens.

# O Anonimous prof que tem mostrado várias análises de redes sociais do ponto de vista quantitativo. Destaque para esse post onde o autor discute como recolheu dados e analisou a partir do Last.fm.