Usando ARS para Mídia Social II - Medidas


Falei no outro post rapidamente sobre os elementos básicos pra se entender um grafo. Agora vou falar um pouco mais das principais métricas que são usadas. Iniciarei com algumas métricas mais gerais, depois passaremos a algumas mais específicas. É importante notar que algumas métricas dizem respeito à posição do nó na rede (a representação do ator) e outras, dizem respeito à rede como um todo. Neste primeiro momento, falarei das medidas mais relacionadas aos nós. Novamente, estou aqui colocando de forma simplificada o que esses elementos significam. Vou dar também alguns exemplos, mas a definição mais específica do sentido e da importância da medida é construída pelo pesquisador, a partir do corpus e dos elementos escolhidos para a análise.

a) Grau do Nó - Essa é a primeira e mais simples medida. Ela representa o número de conexões que um determinado nó possui. Quanto mais conexões, mais central o nó é para a rede. Um grafo direcionado tem dois graus: o indegree que representa a quantidade de conexões que um determinado nó recebe e o outdegree que representa a quantidade de conexões que o nó faz. O grafo não direcionado, por outro lado, tem apenas um grau, que é o número de conexões. Assim, o grau de centralidade de um nó A no Twitter poderia ser representada pela quantidade de conexões que este nó possui (indegree ou outdegree, seguidores e seguidos). No exemplo a seguir vemos os nós maiores no grafo determinados pelo indegree (nós maiores com indegree maior). 

degree.pngOs graus dos nós mostram informações diferentes. O indegree pode, por exemplo, indicar alguém muito popular na rede, enquanto o outdegree pode indicar atores que são mais ativos e mais mobilizadores. 

b) Grau de Intermediação (Betweness) - O grau de intermediação é outra medida de centralidade do nó. Entretanto, ele mede o quão "entre" grupos no grafo um determinado nó está, ou o número de vezes em que o nó é "ponte" entre vários grupos de nós. Nós com altos graus de intermediação são aqueles que conectam grupos diferentes (e desconectados entre si) dentro do grafo. Assim, imagine dois grupos de usuários do Twitter: fãs do Luan Santana e do Restart. Eles são muito conectados a seus pares (outros fãs do mesmo grupo/cantor). Entretanto, não são muito conectados entre si, porque quem curte um não necessariamente curte o outro. Ainda assim, há alguns usuários que gostam dos dois. Esses poucos são usuários que estão conectados aos dois grupos. São pontes, usuários com alto grau de centralidade betweness. No exemplo a seguir, temos um grafo onde os maiores nós são aqueles com maior centralidade betweness.

betweeness.pngEssa medida é muito importante para estudos de mídia social. Ela pode, por exemplo, indicar quais nós são mais centrais para conectar grupos diferentes de usuarios, que é um tipo de influência importante, especialmente no que diz respeito a públicos diferentes.

c) Grau de Proximidade (Closeness) - O grau de proximidade é uma medida do quanto um determinado nó está próximo dos demais na rede, ou ainda, qual é a distância média deste nó dos demais. A medida dá-se pelo número de pontes, ou ainda, de nós que conectam vários grupos que não são interconectados. Estes nós acabam reduzindo as distâncias entre todos os nós do grafo. Os nós com maior grau proximidade, portanto, tendem a ser aqueles com menor distância média de todos os demais nós no grafo. Assim, no mesmo exemplo anterior, os fãs do grupo do Restart terão maior grau de proximidade entre si, mas menor grau de proximidade dos fãs do Luan Santana. Quanto mais "pontes" tivermos no grafo, portanto, maior será o grau de proximidade geral. No exemplo a seguir, vemos o mesmo grafo anterior, mas com os nós com maior grau de proximidade maiores.

closeness.png
Essa medida é relevante para observar quais nós estão mais próximos dos demais no grupo. Essa medida também pode trazer elementos importantes de identificação de grupos ou de tipos diferentes de influenciadores também. Observe como, dependendo da medida que se olha, os nós mais importantes (maiores) mudam.

d) Centralidade Eingenvector - Esta medida foca na influência do nó na rede. A idéia aqui é quantificar essa influência, através da avaliação dos nós. Basicamente, essa medida valoriza mais nós que recebem conexões de nós que também são valorizados do que nós que recebem conexões de outros nós com um valor baixo. Assim, em um determinado grafo, um nó que receba 3 conexões de outros nós com alto grau vai ter uma centralidade eingenvector maior do que um outro nó com outras 3 conexões de nós com graus mais baixos. Em termos simples, poderíamos imaginar novamente no exemplo do Twitter. Uma conta que tenha seguidores mais populares, ou seja, outras contas com um alto número de seguidores (maior indegree) tende a ter uma centralidade eigenvector maior do que outra conta com um mesmo número de seguidores que, na média, tem menos seguidores (menor indegree).   

No próximo post, falarei um pouco das medidas de rede em geral. Depois, ainda pretendo comentar sobre os modos de coleta/análise e o toolset de ferramentas de coleta e análise dos dados. :)