Dejo la presentación «El Análisis de Redes Sociales en la era de los datos masivos» hecho para el III Congreso REDU (Quito, Educador) el 26 de noviembre de 2015.
Reflexiones sobre ecologías y espacios del aprendizaje, análisis del aprendizaje y análisis de redes sociales, visualización de datos, Big Data y otros temas emergentes
Dejo la presentación «El Análisis de Redes Sociales en la era de los datos masivos» hecho para el III Congreso REDU (Quito, Educador) el 26 de noviembre de 2015.
Independientemente de la evolución de los modelos computacionales de los sistemas sociales, el análisis de redes sociales surgió en los años 1970 y 1980 de los avances en la teoría de grafos, de la investigación en estadísticas y estudios de la estructura social como un método de análisis diferente y de carácter relacional. Este se fue articulando con las investigaciones de los sociólogos como James S. Coleman, Harrison White, Linton Freeman (tiene un libro de la evolución de redes muy interesante), J. Clyde Mitchell, M. Granovetter, Ronald Burt y Barry Wellman (todo un monstruo en publicaciones y equipos de investigación desde Canadá). Aunque no sea computacional se puede uno retrotaer a la década de los años 30 del siglo pasado con las investigaciones de Jacob L. Moreno como antecedente con su sociometría y también en antropólogos y etnógrafos en décadas posteriores. La penetración cada vez mayor de las tecnologías informáticas y de las telecomunicaciones en los años 1980 y 1990 exigían técnicas analíticas, tales como el análisis de redes y la modelización multinivel, que podrían escalar a conjuntos de datos cada vez más complejos y grandes. La ola más reciente de investigaciones en sociología computacional es utilizar el análisis de redes y técnicas estadísticas avanzadas para analizar grandes bases de datos informáticos de las delegaciones electrónicas de datos de comportamiento, en lugar de emplear simulaciones. Los registros electrónicos como el correo electrónico y los registros de mensajes instantáneos, los enlaces de la web, el uso del teléfono móvil y la discusión en foros científicos permiten a los científicos sociales observar directamente y analizar el comportamiento social en múltiples puntos en el tiempo (de carácter dinámico) y múltiples niveles de análisis sin las limitaciones del tradicional método empírico, tales como entrevistas, observación de los participantes, o mejoras en una encuesta. Las mejoras continuas en los automáticos algoritmos de aprendizaje (y la relación cada vez más estrecha con el análisis del aprendizaje – Learning Analytics) han permitido asimismo a los científicos sociales y a los empresarios utilizar nuevas técnicas para identificar los patrones latentes y significativo de la interacción social y la evolución en los grandes conjuntos de datos electrónicos.
Actualmente (en la anterior década y principios de esta) se ha expandido y explosionado a otros campos del conocimiento. La forma de presentarlo se ha relacionado con los métodos de la visualización de datos y más concretamente de la visualización de redes y la parte de visualización analítica a nivel científico (campo en el que queda mucho que investigar). Presentó en forma de mapa las áreas de la sociología computacional.
Crear su propio mapa mental a MindMeister
Este es un trabajo de clasificación que he ido desarrollando e invirtiendo tiempo para dilucidar y comprender mejor mi labor como asesor en redes sociales en organizaciones y universidades en países iberoamericanos. He intendado dar una serie de tópicos a través de las investigaciones hechas desde los años 50 del siglo pasado. Algunos de los tópicos (hibridados e interdisciplinares) que suelen ser uso frecuente en datos tomados de redes sociales.:
Análisis estadístico de redes sociales: uno de los trabajos pioneros en este campo es el experimento de Milgram. Creo que es uno de los primeros trabajos de un análisis amplio de datos con propiedades estructurales a gran escala. Es la investigación más frecuente y común. La conducta de la conectividad de los nodos se examina para ver si la mayor parte de los nodos tienen pocas conexiones, con muchos “hubs” o si los grados están distribuidos más igualmente. Se examina el comportamiento del agrupamiento de los nodos en redes sociales típicas. Otro tema importante en este tópico son las características temporales típicas de las redes sociales. Por ejemplo, examinando cómo varía la estructra a medida que crece la red. Dado que la red evoluciona a lo largo del tiempo, se puede añadir a la red nuevas entidades, aunque ciertas propiedades del grafo puedan continuar retenidas a pesar de esto. También se examina la conducta y distribución de las componentes del grafo.
Caminos aleatorios y sus aplicaciones en redes sociales: la clasificación jerárquica en redes [ranking] es uno de los métodos mejor conocidos en la búsqueda en web. Empezando con bien conocido algoritmo PageRank de Google para clasificar documentos web, el principio más amplio se puede aplicar para buscar y clasificar entidades y actores en las redes sociales. El algoritmo de PageRank usa técnicas aleatorias para el proceso de clasificación. La idea es que el enfoque del camino aleatorio [trayectorias vitales de las que hablo en #eduvida y que tienen sus algunso marcos teóricos como aprendizaje experiencial y aprendizaje biográfico de Peter Alheit) se usa en la red en orden a estimar la probabilidad de visitar cada nodo. Esta probabilidad se estima como el PageRank. Claramente, los nodos que están estructuralmente bien conectados tienen un PageRank alto y también son, naturalmente, de gran importancia. Las técnicas de camino/trayectoria aleatoria también se puden usar para personalizar el proceso de cálculo del PageRank polarizando el rango hacia tipos particulares de nodos y sus influencias.
Otro aspecto de investigación es la serindipia que emerge en el análisis de las trayectorias en redes sociales dinámicas.
Detección de comunidad en redes sociales: uno de los problemas más importantes en el contexto del análisis de redes sociales es el de la detección de comunidades. El problema de la detección de comunidad está próximamente relacionado con el clustering e intenta determinar las regiones de una red que son más densas en términos de la conducta de enlaces (clusters específicos por sus relaciones). El tópico está relacionado con el problema genérico de la partición del grafo, que particiona la red en regiones densas basadas en el comportamiento del enlace. Sin embargo, habitualmente las redes sociales son dinámicas y esto conduce a algunos temas únicos desde el punto de vista de la detección de la comunidad. En tales casos, el contenido se puede aprovechar en ordenar a determinar grupos de actores con intereses similares. Se han creado una serie de algoritmos importantes sobre el problema de la detección de comunidad en redes sociales de larga escala. También es factible para al investigación de detección de comunidades en medios sociales [slides].
Clasificación de los nodos en las redes sociales: En muchas aplicaciones, algunos de los nodos de la red social pueden ser etiquetados y puede ser conveniente para usar el atributo y la información estructural en la red social con vistas a propagar estas etiquetas. Por ejemplo, en una aplicación de marketing (todavía existen), se puede conocer a ciertos nodos por estar interesados en un producto particular, y puede ser deseable utilizar el atributo y la información estructural en la red a fin de conocer otros nodos que también pueden estar interesados en el mismo producto. Las redes sociales también contienen una rica información sobre el contenido y la estructura de la red, que pueden ser aprovechados para este fin. Por ejemplo, cuando dos nodos en una red social están vinculados entre sí, es probable que las etiquetas del nodo también se correlacionen. Por lo tanto, la estructura de los vínculos se puede utilizar para propagar las etiquetas entre los diferentes nodos. En este caso para mi, el contenido y los atributos pueden ser utilizados con el fin de mejorar aún más la calidad de la clasificación hecha.
La evolución en las redes sociales dinámicas: Las redes sociales son entidades intrínsecamente dinámicas por su naturaleza. Nuevos miembros se unen a ellas, antiguos miembros dejan de participar, emergen nuevos enlaces a medida que se construyen nuevos contactos, y los enlaces se hacen obsoletos a medida que los miembros dejar de interactuar con algún otro, etc.. Esto conduce a cambios en la estructura de la red social como un todo y de las comunidades que hay en ella. En este contexto surgen dos cuestiones importante:
Análisis de la influencia social: Dado que las redes sociales están diseñadas principalmente sobre la base de las interacciones entre los diferentes participantes, es natural que estas interacciones pueden dar lugar a que los diferentes actores influyan el uno al otro en términos de su comportamiento. Un ejemplo clásico de esto sería una aplicación de marketing viral en la que utilizamos los mensajes entre los participantes interconectados en una red social con el fin de propagar la información a través de las diferentes partes de la red. En este contexto surgen una serie de preguntas naturales:
(a) ¿Cómo podemos modelar la naturaleza de la influencia entre los actores?
(b) ¿Cómo podemos modelar la propagación de la influencia?
(c) ¿Quiénes son los actores más influyentes para la propagación de la influencia?
A mi modo de ver, estos temas proporcionan un profundo conocimiento de la naturaleza del análisis de la influencia en las redes sociales. Hay herramientas específicas para este propósito, pero el análisis de redes sociales es la forma de tratarlo de una forma más holísitica y personalizando el análisis.
Descubrimiento de expertos en las redes: Las redes sociales se pueden utilizar como una herramienta con el fin de identificar a los expertos para una determinada tarea. Por ejemplo, teniendo en cuenta las actividades de los candidatos dentro de un contexto ( casos como la autoría de un documento o responder a una pregunta). Primero describimos los métodos para evaluar el nivel de conocimientos de cada uno de ellos. A menudo, los expertos están organizados en redes que corresponden a redes sociales o estructuras organizativas en una determinada empresa. Muchas de las tareas complejas requieren a menudo la experiencia colectiva de más de un experto. En estos casos, es más realista requerir un equipo de expertos o incluir la externalización con una firma de asesoria que puedan colaborar hacia un objetivo común.
Predicción de enlace en las redes sociales: gran parte de la investigación en minería de redes sociales se centra en el uso de los enlaces a fin de obtener información interesante sobre la red social, tal como las comunidades subyacentes o de subgrupos, o el etiquetado de los nodos con etiquetas de clase y personales (ejemplo de los hashtags). Sin embargo, en la mayor parte de las aplicaciones de redes sociales, los enlaces son dinámicos y pueden variar considerablemente con el tiempo. Por ejemplo, en una red social, los vínculos de amistad se crean continuamente a lo largo del tiempo. Por lo tanto, una pregunta natural es determinar o predecir futuros vínculos en la red social como campo emergente en estos años. El proceso de predicción puede utilizar tanto la estructura de la red como la información del atributos en los nodos diferentes.
Privacidad en las redes sociales: Las redes sociales contienen una gran información sobre el individuo en función de sus intereses, información demográfica, información de los vínculos de amistad y otros atributos. Esto puede conducir a la divulgación de diferentes tipos de información en la red social, como la revelación de la identidad, la divulgación de atributos y la divulgación de la información del vínculo.
Visualización de Redes Sociales (network visualization): a medida que las redes sociales se hacen más grandes y más complejas, el razonamiento acerca de las dinámicas sociales a través de simples estadísticas es muy complicado y no muy intuitivo. La visualización proporciona una forma natural de resumir la información con el fin de hacer que sea mucho más fácil de entender. Los últimos años han sido testigos de una convergencia de análisis de redes sociales y la visualización, junto con la interacción, que está cambiando la manera en que los analistas entienden y caracterizan las redes sociales. En el capítulo 11, se discute el objetivo principal de la visualización en el contexto de la comprensión del usuario y de la interacción. El capítulo también analiza cómo diferentes metáforas están dirigidas hacia la aclaración de diferentes aspectos de las redes sociales, como la estructura y la semántica. Se describen una serie de métodos, en donde los análisis y la visualización se entrelazan para proporcionar una mejor comprensión de la estructura y dinámicas sociales.
Minería de datos en los medios sociales: los medios de comunicación social ofrecen una gran cantidad de datos de redes sociales, que se pueden extraer con el fin de descubrir las aplicaciones comerciales útiles. Las técnicas de minería de datos proporcionan a los investigadores y a los profesionales las herramientas necesarias para analizar el gran, complejo y frecuente cambio en los datos de los medios de comunicación social. En algunos libros y blogs ya hablan de tal fenómeno que hasta los marketinianos ven como lo próximo en Social Media. En algunos blogs como «Data Mining: Text Mining, visualization and social media» de Mathew Husrt. Estamos todavía en la época emergente y de entusiasmo. No creo que sea unas técnicas que hagan cambiar los Social Media.
Minería de texto en las redes sociales: las redes sociales contienen una gran cantidad de texto en los nodos en diversas formas. Por ejemplo, las redes sociales puede contener enlaces a posts, blogs y demás artículos de noticias. En algunos casos, los usuarios pueden etiquetarse mutuamente, que es también una forma de datos de texto sobre los enlaces. El uso del contenido puede mejorar enormemente la calidad de las inferencias que se puedan hacer en el contexto de los grafos y redes sociales.
Integración de sensores en redes sociales con datos: muchos teléfonos móviles ofrecen la posibilidad de que los actores interactúen entre sí dinámicamente y en tiempo real, dependiendo de su ubicación y el estado. Tales aplicaciones también dan lugar a la generación de flujos masivos en tiempo real, que se pueden utilizar para hacer inferencias sobre alguien o sobre las propiedades globales de los objetos que se están rastreando. Dado que la información de la ubicación es privada, esto también nos lleva naturalmente a una serie de preocupaciones sobre la privacidad desde una perspectiva del procesamiento.
Análisis de la red multimedia en los medios sociales: muchos modelos de sitios de compartición tales como Flickr y Youtube que ofrecen la posibilidad de compartir los medios de comunicación. Tales medios compartidos se utilizan a menudo junto con las interacciones de los diferentes usuarios, tales como la colocación de etiquetas o comentarios en diferentes imágenes. Tales ricas redes de información basadas en el contexto se pueden extraer mediante una amplia variedad de aplicaciones que aprovechan la combinación de las etiquetas de usuarios y los datos de imagen en el proceso de extracción y recuperación.
Etiquetado social (tagging): gran parte de la interacción entre los usuarios y las redes sociales se produce en forma de etiquetado, en la que los usuarios adjuntan descripciones cortas de los diferentes objetos en la red social, tales como imágenes, texto, vídeo u otros datos multimedia. En el capítulo se 16 ofrece un estudio detallado de los diversos aspectos del etiquetado. Entramos aquí en los modelos de etiquetado, de la semántica de las etiquetas, de las recomendaciones generadas a través de las etiquetas, de las visualizaciones de las etiquetas, de las aplicaciones de las etiquetas, de la integración de diferentes sistemas de etiquetado y los problemas asociados con el uso del etiquetado. Se discuten muchos temas interesantes, como la razón de la gente para etiquetar, lo que influye en la elección de las etiquetas, la forma de modelar el proceso de etiquetado, tipos de etiquetas, diferentes leyes de energía observados en el dominio de etiquetado, cómo se crean las etiquetas se crean y cómo elegir las etiquetas correctas para la recomendación.
Todos estos campos emergentes del análisis de datos de una red social o un medio social se encuentra todavía en su infancia. Hay una enorme cantidad de trabajo por hacer, particularmente en el área de las redes sociales basadas en el contenido y de carácter temporal (introducción el factor tiempo y porpio de redes dinámicas). Algunas líneas de investigación clave para el futuro son las siguientes:
En todo esto encotramos diversidad de procedencia y de los mismos datos para analizar. Esta visión híbrida en los datos será más importante al analizar las redes en el contexto de datos heterogéneos, en los que los enlaces son de tipos diferentes y corresponden a diferentes tipos de relaciones entre los actores. Una generalización del concepto de redes sociales son las redes de información, en la que los nodos pueden ser actores de entidades, y corresponder estos nodos con las relaciones lógicas entre estas entidades. Tales redes son también heterogéneas, por lo que es cada vez más importante diseñar herramientas y técnicas que puedan analizar eficazamente redes heterogéneas.
Referencias:
© 2025 Blog de Fernando Santamaría
Tema por Anders Noren — Arriba ↑
Comentarios recientes