El análisis de redes sociales en la sociología computacional

Independientemente de la evolución de los modelos computacionales de los sistemas sociales, el análisis de redes sociales surgió en los años 1970 y 1980 de los avances en la teoría de grafos, de la investigación en estadísticas y estudios de la estructura social como un método de análisis diferente y de carácter relacional. Este se fue articulando con las investigaciones de los sociólogos  como James S. Coleman, Harrison White, Linton Freeman (tiene un libro de la evolución de redes muy interesante), J. Clyde Mitchell, M. Granovetter, Ronald Burt y Barry Wellman (todo un monstruo en publicaciones y equipos de investigación desde Canadá). Aunque no sea computacional se puede uno retrotaer a la década de los años 30 del siglo pasado con las investigaciones de Jacob L. Moreno como antecedente con su sociometría y también en antropólogos y etnógrafos en décadas posteriores. La penetración cada vez mayor de las tecnologías informáticas y de las telecomunicaciones en los años 1980 y 1990 exigían técnicas analíticas, tales como el análisis de redes y la modelización multinivel, que podrían escalar a conjuntos de datos cada vez más complejos y grandes. La ola más reciente de investigaciones en sociología computacional es utilizar el análisis de redes y técnicas estadísticas avanzadas para analizar grandes bases de datos informáticos de las delegaciones electrónicas de datos de comportamiento, en lugar de emplear simulaciones. Los registros electrónicos como el correo electrónico y los registros de mensajes instantáneos, los enlaces de la web, el uso del teléfono móvil y la discusión en foros científicos permiten a los científicos sociales observar directamente y analizar el comportamiento social en múltiples puntos en el tiempo (de carácter dinámico) y múltiples niveles de análisis sin las limitaciones del tradicional método empírico, tales como entrevistas, observación de los participantes, o mejoras en una encuesta. Las mejoras continuas en los automáticos algoritmos de aprendizaje (y la relación cada vez más estrecha con el análisis del aprendizaje – Learning Analytics) han permitido asimismo a los científicos sociales y a los empresarios utilizar nuevas técnicas para identificar los patrones latentes y significativo de la interacción social y la evolución en los grandes conjuntos de datos electrónicos.

Actualmente (en la anterior década y principios de esta) se ha expandido y explosionado a otros campos del conocimiento. La forma de presentarlo se ha relacionado con los métodos de la visualización de datos y más concretamente de la visualización de redes y la parte de visualización analítica a nivel científico (campo en el que queda mucho que investigar). Presentó en forma de mapa las áreas de la sociología computacional.


Crear su propio mapa mental a MindMeister

Minería de texto: el auge por el análisis textual y la analítica de las interacciones sociales

Visualización de una minería de textos. Fuente: http://bit.ly/tuwYAE

Este campo de investigación lleva décadas rezagado entre las dos disciplinas que lo han configurado: la inteligencia artificial y la computación lingüística. En estos momentos  tiene un futuro prometedor para el mundo educativo y como uno de los complementos para el análisis del aprendizaje junto a la autorregulación y autogestión del aprendizaje. Requiere de mayor transparencia las aplicaciones que por ahora tienen su dificultad. Dentro de este se está también generando un campo como es el Sentiment Analysis (Análisis sentimental) para ver los comportamientos a través de textos en espacios interactivos como foros o en el mismo Twitter como podemos ver con Twitter Sentiment.

Dice la Wikipedia en la entrada de Text Mining que la minería de texto, a veces alternativamente denominada como minería de datos de texto, toscamente equivalente a análisis del texto, se refiere al proceso de deducir a partir de un texto la información de alta calidad. Esta información de alta calidad normalmente se deriva de la elaboración de patrones y tendencias a través de medios tales como el aprendizaje de patrones estadísticos. La minería de datos habitualmente incluye el proceso de estructuración de la entrada [input] de texto (usualmente análisis, de acuerdo con la adición de algunas características lingüísticas derivadas y la eliminación de otras, y la posterior inserción en una base de datos), deduciendo de patrones dentro de los datos estructurados, y finalmente la evaluación e interpretación de la salida [output]. “Alta calidad” en minería de texto usualmente se refiere a alguna combinación de la relevancia, novedad e interés. Habitualmente las tareas de minería de texto incluyen la categorización, agrupación de texto, extracción de la entidad (conceptos de linguística computacional), producción de taxonomías granulares, análisis de sentimientos, resumen del documento y modelización de la relación de la entidad (es decir, relaciones de aprendizaje entre las denominadas entidades).
Las técnicas de minería de texto han estado ganando en sofisticación a partir de principios de este siglo. Estas técnicas ahora ofrecen formas de descubrir redes sociales a partir de documentos publicados en Internet y de comunicación online basada en texto.
En general, para descubrir redes sociales  a partir de datos textuales, se dan los siguientes pasos:

  • Descubrimiento del nodo. Se identifican todas las referencias a las personas usando nombres, pronombres y dirección de correo electrónico.
  • Correferencia y resolución del alias. Las ambigüedades sobre las personas se resuelven, por ejemplo, diferenciando entre personas con el mismo nombre y creando una identidad individual para esos múltiples alias.
  • Descubrimiento del enlace. Las conexiones sociales están determinadas entre las personas identificadas en los dos primeros pasos.
  • Identificación de la relación y del rol. Se identifica los tipos de vínculos (ej.: amigo, compañero de trabajo, compañero de clase, etc.) y se asignan los roles (ej.: gestor, subordinado, etc.) para cada persona sobre la base del contenido o patrones de la comunicación.

Hasta hace poco, los sitios web más utilizados búsquedas basadas en texto, que sólo se encuentran los documentos que contienen palabras o frases específicas definidas por el usuario. Ahora, a través del uso de la web semántica por medio de ontologías, la minería de textos pueden encontrar contenidos basada en el significado y el contexto (y no sólo por una palabra).

Además, el software de minería de texto puede ser usado para construir grandes expedientes de información sobre personas y acontecimientos específicos. Por ejemplo, grandes conjuntos de datos basados ​​en los datos extraídos de los informes de noticias pueden ser construidos para facilitar el análisis de redes sociales o contra la inteligencia. En efecto, el software de minería de textos pueden actuar en una capacidad similar a un de analista de inteligencia o el bibliotecario de investigación, aunque con un alcance más limitado de análisis.
Minería de textos también se utiliza en algunos correo electrónico o filtros de spam y cómo determina las características de los mensajes que sean probablemente anuncios o el material no deseado.
En los próximo post hablaremos de una forma de análisis textual para generar un csv y poder establecer un grafo por medio de la aplicación Gephi y con las propiedades propias del análisis de redes como podemos apreciar en este video:

Text Network Analysis with Gephi from Dmitry Paranyushkin on Vimeo.

Referencias:

La eclosión de las investigaciones en Análisis de Redes Sociales

Una de las ideas más potentes en las ciencias sociales es la noción de que los individuos están embebidos en gruesas redes de relaciones sociales e interacciones. La teoría de red social (Social Network Theory) proporciona una respuesta a un problema que ha preocupado a la filosofía de caracter social desde la época de Platón, o sea, el problema del orden social (de ahí sus raíces simelianas): cómo los individuos autónomos pueden combinarse para crear sociedades tolerantes y funcionales. La teoría de red también proporciona explicaciones para una gran cantidad de fenómenos sociales, desde la creatividad individual hasta la rentabilidad corporativa. La investigación de red es hoy un tema “caliente”, con la cantidad de artículos en Web of Knowledge sobre el tópico de “redes sociales” que casi triplican a la de la década pasada. Los cuadernos de ciencia (Readers of Science) ya son habituales en la investigación de red en física y biología, pero pueden serlo menos en lo que se ha estado haciendo en ciencias sociales.
Lo que es el análisis de redes sociales (ARS, #sna) sigue creciendo como se muestra en la figura de abajo (Vía Network Theorizing de S. Borgatti. Aparece en más papers de Borgatti) como a partir de los primeros años de este siglo han ido creciendo de manera casi exponencial.

 El interés en las redes abarca todos los ciencias sociales y está creciendo aún más rápido en  Física, Epidemiología y en Biología. Las redes sociales se han utilizado para entender el desempeño del trabajo en una organización, el volumen de negocios con las entradas y salidas, promoción e innovación en agujeros estructurales de R. Burt, en los análisis que se hace desde cuerpos de inteligencia, para analizar las redes terroristas, para detectar comunidades en un larga estructura de red, para analizar las dimensiones políticas en corporaciones de este ámbito y cómo están conectadas, en los movimientos sociales organizados y los espontáneos, en las redes culturales con los interesantes estudios de Paul DiMaggio, en las redes de investigación con sus citaciones y para darle una perspectiva distinta a investigaciones con modelos estadísticos para actores y sus relaciones. Puedo continuar hasta aburrir, pero es fundamental en muchas investigaciones darle el cariz de analítica social (y no social) que está invadiendo muchos aspectos de esta sociedad de la interacción con Big Data.

Artículos compartidos en Google Scholar por año y que aparece "Social Network" en título

Artículos compartidos en Google Scholar por año y que aparece "Social Network" en título

VennMaker, una herramienta de mapeo de las interacciones

VennMaker es una herramienta de mapeo de las interacciones de las redes centrada en los actores. Se trata de herramienta para analizar redes personales o egocéntricas. Existe versión de Windows pero lo mejor es el fichero jar para ejecutarse como Java en cualquier S.O. que admita Java.
Dentro de las ciencias sociales, sólo herramientas bastante complejas y que requieren una amplia curva de aprendizaje han estado disponibles hasta ahora para recopilar y analizar cuantitativamente los datos para el análisis de redes sociales. Se necesitan instrumentos convincentes que sean capaces de mostrar y analizar cualitativa redes con suporte social y que han faltado hasta ahora.

El proyecto VennMaker ha cruzado esa brecha y ha diseñado una herramienta basada en software que es tan conveniente para la investigación de la red social de consultoría centrada en el cliente.

Una rama de la organización dentro de la investigación y la consultoría se ha convertido en los últimos años que se visualiza opiniones de miembros de la organización en un proceso común y los utiliza como una plantilla adicional para el análisis y la interpretación. Aunque estas técnicas se aplican con éxito en la consultoría y asistencia para el desarrollo los procesos tanto a nivel nacional e internacional, que sea objeto de críticas de los círculos académicos debido a su ser no replicable, ni representante, o simplemente pasan desapercibidos.

Como se comenta en su web, el objetivo del grupo de investigación interdisciplinario en Trier es desarrollar una herramienta de software que permite al usuario recopilar de forma interactiva las relaciones de la red desde el punto de vista del actor y los hagan comparables y analizables cuantitativamente por medio de una interfaz gráfica de usuario que puede ser analizado de manera intuitiva. El punto crucial de este enfoque es que las personas que la prueban son capaces de visualizar y evaluar cualitativamente sus propias redes, al mismo tiempo que se refleja la retrospectiva con el propio investigador y teniendo en cuenta las alteraciones deseable. Al mismo tiempo, todo el procedimiento y los resultados son registrados digitalmente y pueden ser procesados ​​y validados. La herramienta podría utilizarse tanto para fines de investigación como de consultoría.

Desde el punto de vista de las ciencias sociales, el vínculo hasta entonces perdido entre el análisis cuantitativo y cualitativo de la red. Ha habido muchos avances en este ámbito, a nuestro entender, sin embargo, no hay un proyecto que haya resuelto el problema de la complejidad y la cuestión de la disponibilidad de los datos cualitativos y cuantitativos hasta el momento. El desarrollo de VennMaker dentro del clúster de excelencia se basa en una larga experiencia en el desarrollo y aplicación de metodologías de investigación participativa (Schoenhuth 1995, 1998, 2003, 2007), en la minería de datos visuales y de dibujo y gráficos (Pohl et al. 2004, 2006, 2007) como en la experiencia profesional de otras disciplinas en el que participan universidades de Trier y Mainz, ampliando así la investigación de la red tradicional con una herramienta metodológica innovadora y única.

Mapa sobre conceptos y medidas para el análisis de redes

A partir del amplio artículo de Robert A. Hanneman y Mark Riddle (“Concepts and Measures for Basic Network Analysis”) aparecido en The SAGE Handbook of Social Network Analysis. Ed by John Scott y Peter J. Carrington (2011). He elaborado a partir de ese libro y el de Wasserman y Faust (1994).

Actualización:

A parte del análisis egocéntrico y el análisis de redes sociocéntricas o completas, hay algunos investigadores (Russell P. Cole y Elliot H. Weinbaum en el volumen de Daly) que destacan el papel de la cognición, a diferencia de estructura simple de una acción social. Es lo que vienen llamando redes cognitivas. Por esta razón, se han interesado en un tercer nivel de análisis cognitivo en Internet. En el análisis de redes sociales, las estructuras sociales de carácter cognitivo se identifican sobre la base de datos auto-informe que ilustran la percepción de los actores de lo que está relacionado con quién y de qué manera dentro de un sistema social determinado.
Una perspectiva de estructura social cognitiva en las redes sociales hace hincapié en que los actores tienen una percepción de los patrones de interacción en determinadas redes, y, por ello, tiene consecuencias en sus actitudes y acciones, más allá de la realidad social estructural en el que los actores sociales están inmersos.
Una clara desventaja del enfoque de esta estructura social cognitiva es que a medida que cada informante se le pide que informe sobre todos los pares de actores dentro de su red, entonces el número de elementos y de recolección de datos aumenta exponencialmente. En realidad, esto limita la viabilidad de este enfoque a las redes que son relativamente pequeñas. Su viabilidad de análisis es mejor en redes de larga escala. El análisis de este tipo de redes es factible para PLN (Personal Learning Network). Estos embeben “redes cognitivas” en su estructura. Las investigaciones en este campo son débiles y requieren más trabajos empíricos.

Referencias:

  • Daly, A. J. (Ed.). (2010). Social Network Theory and Educational Change. Cambridge, Massachusetts: Harvard Education Press.
  • Engeström, Y. (2008). From Teams to Knots: Activity-Theoretical Studies of Collaboration and Learning at Work. Cambridge: Cambridge University Press.
  • Mahmoud, Q. H. (Ed.). (2007). Cognitive networks: Towards Self-Aware Networks. West Sussex: Wiley Online Library.
  • Wasserman, S., & Faust, K. (1994). Social Network Analysis: Methods and Applications. Cambridge University Press.