Blog de Fernando Santamaría

Reflexiones sobre ecologías y espacios del aprendizaje, análisis del aprendizaje y análisis de redes sociales, visualización de datos, Big Data y otros temas emergentes

Tópicos emergentes para la investigación en redes sociales

Este es un trabajo de clasificación que he ido desarrollando e invirtiendo tiempo para dilucidar y comprender mejor mi labor como asesor en redes sociales en organizaciones y universidades en países iberoamericanos. He intendado dar una serie de tópicos a través de las investigaciones hechas desde los años 50 del siglo pasado. Algunos de los tópicos (hibridados e interdisciplinares) que suelen ser uso frecuente en datos tomados de redes sociales.:

Análisis estadístico de redes sociales: uno de los trabajos pioneros en este campo es el experimento de Milgram. Creo que es uno de los primeros trabajos de un análisis amplio de datos con propiedades estructurales a gran escala. Es la investigación más frecuente y común.  La conducta de la conectividad de los nodos se examina para ver si la mayor parte de los nodos tienen pocas conexiones, con muchos “hubs” o si los grados están distribuidos más igualmente. Se examina el comportamiento del agrupamiento de los nodos en redes sociales típicas. Otro tema importante en este tópico son las características temporales típicas de las redes sociales. Por ejemplo, examinando cómo varía la estructra a medida que crece la red. Dado que la red evoluciona a lo largo del tiempo, se puede añadir a la red nuevas entidades, aunque ciertas propiedades del grafo puedan continuar retenidas a pesar de esto. También se examina la conducta y distribución de las componentes del grafo.

Caminos aleatorios y sus aplicaciones en redes sociales: la clasificación jerárquica en redes [ranking] es uno de los métodos mejor conocidos en la búsqueda en web. Empezando con bien conocido algoritmo PageRank de Google para clasificar documentos web, el principio más amplio se puede aplicar para buscar y clasificar entidades y actores en las redes sociales. El algoritmo de PageRank usa técnicas aleatorias para el proceso de clasificación. La idea es que el enfoque del camino aleatorio [trayectorias vitales de las que hablo en #eduvida y que tienen sus algunso marcos teóricos como aprendizaje experiencial y aprendizaje biográfico de Peter Alheit) se usa en la red  en orden a estimar la probabilidad de visitar cada nodo. Esta probabilidad se estima como el PageRank. Claramente, los nodos que están estructuralmente bien conectados tienen un PageRank alto y también son, naturalmente, de gran importancia. Las técnicas de camino/trayectoria aleatoria también se puden usar para personalizar el proceso de cálculo del PageRank polarizando el rango hacia tipos particulares de nodos y sus influencias.

Otro aspecto de investigación es la serindipia que emerge en el análisis de las trayectorias en redes sociales dinámicas.

Detección de comunidad en redes sociales: uno de los problemas más importantes en el contexto del análisis de redes sociales es el de la detección de comunidades. El     problema de la detección de comunidad está próximamente relacionado con el clustering e intenta determinar las regiones de una red que son más densas en términos de la conducta de enlaces (clusters específicos por sus relaciones). El tópico está relacionado con el problema genérico de la partición del grafo, que particiona la red en regiones densas basadas en el comportamiento del enlace. Sin embargo, habitualmente las redes sociales son dinámicas y esto conduce a algunos temas únicos desde el punto de vista de la detección de la comunidad. En tales casos, el contenido se puede aprovechar en ordenar a determinar grupos de actores con intereses similares. Se han creado una serie de algoritmos importantes sobre el problema de la detección de comunidad en redes sociales de larga escala. También es factible para al investigación de detección de comunidades en medios sociales [slides].

Clasificación de los nodos en las redes sociales: En muchas aplicaciones, algunos de los nodos de la red social pueden ser etiquetados y puede ser conveniente para usar el atributo y la información estructural en la red social con vistas a propagar estas etiquetas. Por ejemplo, en una aplicación de marketing (todavía existen), se puede conocer a ciertos nodos por estar interesados en un producto particular, y puede ser deseable utilizar el atributo y la información estructural en la red a fin de conocer otros nodos que también pueden estar interesados en el mismo producto. Las redes sociales también contienen una rica información sobre el contenido y la estructura de la red, que pueden ser aprovechados para este fin. Por ejemplo, cuando dos nodos en una red social están vinculados entre sí, es probable que las etiquetas del nodo también se correlacionen. Por lo tanto, la estructura de los vínculos se puede utilizar para propagar las etiquetas entre los diferentes nodos. En este caso para mi, el contenido y los atributos pueden ser utilizados con el fin de mejorar aún más la calidad de la clasificación hecha.

La evolución en las redes sociales dinámicas: Las redes sociales son  entidades intrínsecamente dinámicas por su naturaleza. Nuevos miembros se unen a ellas, antiguos miembros dejan de participar, emergen nuevos enlaces a medida que se construyen nuevos contactos, y los enlaces se hacen obsoletos a medida que los miembros dejar de interactuar con algún otro, etc.. Esto conduce a cambios en la estructura de la red social como un todo y de las comunidades que hay en ella. En este contexto surgen dos cuestiones importante:

  • ¿Cuáles son las leyes que rigen los cambios a largo plazo en la red social a través del tiempo?, Y también una pregunta subsidiaria de la anterior como ¿cuáles se observan con frecuencia en las clases de las redes sociales a gran escala?
  • (b) ¿Cómo evoluciona una comunidad dentro de una plataforma social a lo largo del tiempo? ¿Qué cambios pueden ocurrir y cómo capturarlos y presentarlos?

Análisis de la influencia social: Dado que las redes sociales están diseñadas principalmente sobre la base de las interacciones entre los diferentes participantes, es natural que estas interacciones pueden dar lugar a que los diferentes actores influyan el uno al otro en términos de su comportamiento. Un ejemplo clásico de esto sería una aplicación de marketing viral en la que utilizamos los mensajes entre los participantes interconectados en una red social con el fin de propagar la información a través de las diferentes partes de la red. En este contexto surgen una serie de preguntas naturales:

(a) ¿Cómo podemos modelar la naturaleza de la influencia entre los actores?
(b) ¿Cómo podemos modelar la propagación de la influencia?
(c) ¿Quiénes son los actores más influyentes para la propagación de la influencia?
A mi modo de ver, estos temas proporcionan un profundo conocimiento de la naturaleza del análisis de la influencia en las redes sociales. Hay herramientas específicas para este propósito, pero el análisis de redes sociales es la forma de tratarlo de una forma más holísitica y personalizando el análisis.

Descubrimiento de expertos en las redes: Las redes sociales se pueden utilizar como una herramienta con el fin de identificar a los expertos para una determinada tarea. Por ejemplo, teniendo en cuenta las actividades de los candidatos dentro de un contexto ( casos como la autoría de un documento o responder a una pregunta). Primero describimos los métodos para evaluar el nivel de conocimientos de cada uno de ellos. A menudo, los expertos están organizados en redes que corresponden a redes sociales o estructuras organizativas en una determinada empresa. Muchas de las tareas complejas requieren a menudo la experiencia colectiva de más de un experto. En estos casos, es más realista requerir un equipo de expertos o incluir la externalización con una firma de asesoria que puedan colaborar hacia un objetivo común.

Predicción de enlace en las redes sociales: gran parte de la investigación en minería de redes sociales se centra en el uso de los enlaces a fin de obtener información interesante sobre la red social, tal como las comunidades subyacentes o de subgrupos, o el etiquetado de los nodos con etiquetas de clase y personales (ejemplo de los hashtags). Sin embargo, en la mayor parte de las aplicaciones de redes sociales, los enlaces son dinámicos y pueden variar considerablemente con el tiempo. Por ejemplo, en una red social, los vínculos de amistad se crean continuamente a lo largo del tiempo. Por lo tanto, una pregunta natural es determinar o predecir futuros vínculos en la red social como campo emergente en estos años. El proceso de predicción puede utilizar tanto la estructura de la red como la información del atributos en los nodos diferentes.

Privacidad en las redes sociales: Las redes sociales contienen una gran información sobre el individuo en función de sus intereses, información demográfica, información de los vínculos de amistad y otros atributos. Esto puede conducir a la divulgación de diferentes tipos de información en la red social, como la revelación de la identidad, la divulgación de atributos y la divulgación de la información del vínculo.

Visualización de Redes Sociales (network visualization): a medida que las redes sociales se hacen más grandes y más complejas, el razonamiento acerca de las dinámicas sociales a través de simples estadísticas es muy complicado y no muy intuitivo. La visualización proporciona una forma natural de resumir la información con el fin de hacer que sea mucho más fácil de entender. Los últimos años han sido testigos de una convergencia de análisis de redes sociales y la visualización, junto con la interacción, que está cambiando la manera en que los analistas entienden y caracterizan las redes sociales. En el capítulo 11, se discute  el objetivo principal de la visualización en el contexto de la comprensión del usuario y de la interacción. El capítulo también analiza cómo diferentes metáforas están dirigidas hacia la aclaración de diferentes aspectos de las redes sociales, como la estructura y la semántica. Se describen una serie de métodos, en donde los análisis y la visualización se entrelazan para proporcionar una mejor comprensión de la estructura y dinámicas sociales.

Minería de datos en los medios sociales: los medios de comunicación social ofrecen una gran cantidad de datos de redes sociales, que se pueden extraer con el fin de descubrir las aplicaciones comerciales útiles. Las técnicas de minería de datos proporcionan a los investigadores y a los profesionales las herramientas necesarias para analizar el gran, complejo y frecuente cambio en los datos de los medios de comunicación social. En algunos libros y blogs ya hablan de tal fenómeno que hasta los marketinianos ven como lo próximo en Social Media. En algunos blogs como “Data Mining: Text Mining, visualization and social media” de Mathew Husrt. Estamos todavía en la época emergente y de entusiasmo. No creo que sea unas técnicas que hagan cambiar los Social Media.

Minería de texto en las redes sociales: las redes sociales contienen una gran cantidad de texto en los nodos en diversas formas. Por ejemplo, las redes sociales puede contener enlaces a posts, blogs y demás artículos de noticias. En algunos casos, los usuarios pueden etiquetarse mutuamente, que es también una forma de datos de texto sobre los enlaces. El uso del contenido puede mejorar enormemente la calidad de las inferencias que se puedan hacer en el contexto de los grafos y redes sociales.

Integración de sensores en redes sociales con datos: muchos teléfonos móviles ofrecen la posibilidad de que los actores interactúen entre sí dinámicamente y en tiempo real, dependiendo de su ubicación y el estado. Tales aplicaciones también dan lugar a la generación de flujos masivos en tiempo real, que se pueden utilizar para hacer inferencias sobre alguien o sobre las propiedades globales de los objetos que se están rastreando. Dado que la información de la ubicación es privada, esto también nos lleva naturalmente a una serie de preocupaciones sobre la privacidad desde una perspectiva del procesamiento.

Análisis de la red multimedia en los medios sociales: muchos modelos de sitios de compartición tales como Flickr y Youtube que ofrecen la posibilidad de compartir los medios de comunicación. Tales medios compartidos se utilizan a menudo junto con las interacciones de los diferentes usuarios, tales como la colocación de etiquetas o comentarios en diferentes imágenes. Tales ricas redes de información basadas en el contexto se pueden extraer mediante una amplia variedad de aplicaciones que aprovechan la combinación de las etiquetas de usuarios y los datos de imagen en el proceso de extracción y recuperación.

Etiquetado social (tagging): gran parte de la interacción entre los usuarios y las redes sociales se produce en forma de etiquetado, en la que los usuarios adjuntan descripciones cortas de los diferentes objetos en la red social, tales como imágenes, texto, vídeo u otros datos multimedia. En el capítulo se 16 ofrece un estudio detallado de los diversos aspectos del etiquetado. Entramos aquí en los modelos de etiquetado, de la semántica de las etiquetas, de las recomendaciones generadas a través de las etiquetas, de las visualizaciones de las etiquetas, de las aplicaciones de las etiquetas, de la integración de diferentes sistemas de etiquetado y los problemas asociados con el uso del etiquetado. Se discuten muchos temas interesantes, como la razón de la gente para etiquetar, lo que influye en la elección de las etiquetas, la forma de modelar el proceso de etiquetado, tipos de etiquetas, diferentes leyes de energía observados en el dominio de etiquetado, cómo se crean las etiquetas se crean y cómo elegir las etiquetas correctas para la recomendación.

Todos estos campos emergentes del análisis de datos de una red social o un medio social se encuentra todavía en su infancia. Hay una enorme cantidad de trabajo por hacer, particularmente en el área de las redes sociales basadas en el contenido y de carácter temporal (introducción el factor tiempo y porpio de redes dinámicas). Algunas líneas de investigación clave para el futuro son las siguientes:
En todo esto encotramos diversidad de procedencia y de los mismos datos para analizar. Esta visión híbrida en los datos será más importante al analizar las redes en el contexto de datos heterogéneos, en los que los enlaces son de tipos diferentes y corresponden a diferentes tipos de relaciones entre los actores. Una generalización del concepto de redes sociales son las redes de información, en la que los nodos pueden ser actores de entidades, y corresponder estos nodos con las relaciones lógicas entre estas entidades. Tales redes son también heterogéneas, por lo que es cada vez más importante diseñar herramientas y técnicas que  puedan analizar eficazamente redes heterogéneas.

Referencias:

Aggarwal, C. C. (2011). Social Network Data Analytics (1st ed.). Springer.
Aggarwal, C. C. (2009). Managing and Mining Uncertain Data. Springer.
Carrington, P. J., Scott, J., & Wasserman, S. (2005). Models and Methods in Social Network Analysis. Cambridge University Press.
Kadushin, C. (2011). Understanding Social Networks: Theories, Concepts, and Findings. Oxford University Press, USA.
Kadushin, C. (2012). Understanding Social Networks:Theories, Concepts, and Findings. New York: Oxford University Press.
Kilduff, M., & Tsai, W. (2003). Social Networks and Organizations. Sage Publications Ltd.
Prell, C. (2011). Social Network Analysis: History, Theory and Methodology. SAGE Publications.
Russell, M. A. (2011). Mining the Social Web: Analyzing Data from Facebook, Twitter, LinkedIn, and Other Social Media Sites (1st ed.). O’Reilly Media.
Scott, J. P., & Carrington, P. (2011). The SAGE Handbook of Social Network Analysis. Sage Publications Ltd.

About the author

Fernando Santamaría González Soy un investigador y formador en espacios online. Trabajando e investigando en temas de aprendizaje emergente. Fernando Santamaría González

1 Comentario

  1. Wonderful piece of writing!

    In your interesting post you mention “En el capítulo se 16 ofrece un estudio detallado de los diversos aspectos del etiquetado”. What book? What chapter? You see, I know tagging is really important and I have to write something about it, even though I don’t know where to start. Can you help?
    Thank you.

    Paula

Deja un comentario