La revolución de los datos sociales: una nueva ciencia para interpretar los comportamientos sociales

Portada del libro

El libro “Pulse: The New Science of Harnessing Internet Buzz to Track Threats and Opportunities” de Douglas Hubbard (anteriormente había publicado otro de gran interés y que no he tenido ocasión de leer. Se titula “How to Measure Anything: Finding the Value of Intangibles in Business“) describe y analiza un nuevo panorama de la ciencia por la capacidad que se tiene de generar análisis de esas huellas digitales. El le llama Pulse. También en la enseñanza tendrá una capacidad disruptiva y de ser un “trigger” (como disparador) para el cambio. Un libro recomendado y que pongo algunas de los párrafos con los que abren el Capítulo 1 “An Emerging Science: What is this new thing?”. Esta ciencia emergente que analiza los datos de manera transparente y con la capacidad de poder visualizarlos en tiempo real. Una nueva era para la medición y predicción de la sociedad.

La primera mitad del siglo XXI está viendo el surgimiento de un nuevo tipo de instrumentos científicos que permitan medir las tendencias más importantes en la sociedad. Más personas pasan más tiempo haciendo más cosas en línea y al hacerlo, dejan tras de sí un gran registro digital. Mediante la combinación de esas “huellas digitales” tanto sociólogos como psicólogos, economistas e incluso los médicos están aprendiendo a medir los aspectos de nuestra sociedad que de otra manera sería prácticamente invisible. El análisis de estas huellas digitales generará nuevos descubrimientos en todos los ámbitos de la investigación. El volumen de esos datos será detectar nuevos patrones en los mercados, en la opinión pública e incluso la salud y la seguridad.

Datos disponibles al público acerca de la frecuencia de determinadas búsquedas en Google se han utilizado para rastrear los brotes de gripe, la confianza de los consumidores o el niveles de desempleo más rápido que las autoridades del gobierno son capaces de hacerlo. El análisis de millones de “tweets” en Twitter se han utilizado para predecir la popularidad de una película, las aprobación calificaciones de las presidenciales a nivel político e incluso los movimientos del mercado de valores y la bolsa. Anuncios en sitios como Craigslist se correlacionan con las ejecuciones hipotecarias y el desempleo. Los datos recogidos de forma pasiva en los teléfonos móviles pueden ser utilizados para rastrear patrones de tráfico, enfermedades, e incluso daños después de un terremoto. Y esto es sólo el principio.

En educación a la hora de establecer metodologías cuya base es la red (Networked Learning) y establecidas en ecosistemas abiertos generan multitud de tráfico y acciones interactivas sin una delimitación clara (veáse MOOC). En estos casos hacer la evaluación del propio aprendizaje de los estudiantes es tarea ingente, o, metafóricamente, matar elefantes con un matamoscas.

Por eso creo que es revolucionario y disruptivo con respecto a la concepciones de medida anteriores. Esto es un hecho más potente y disruptivo de lo que fue para la educación la web social. El problema es que vivimos en un constante devenir de formas disruptivas. Por esto, algunos autores le han llamado “la revolución de los datos sociales (Social data revolution)

Por eso, incluso los científicos más reservados describen este fenómeno como una revolución en el estudio de la humanidad y en la previsión de la conducta humana. Estas herramientas cambiará fundamentalmente la forma en que los insights serán encontrados entre el análisis de esos datos cruzados. En última instancia, esta nueva fuente de datos (datos inteligentes + sensores + tiempo real) influirá en cómo algunas de las decisiones más importantes son tomadas por individuos, empresas y gobiernos.

En la crisis actual, por ejemplo hay las suficientes “señales” (palabra clave para esta era de los datos) como para ver que deben producirse cambios reales y disruptivos para que no sea una hecatombe.

Sólo recientemente los investigadores han ido descubriendo la manera de seguir las tendencias económicas, los brotes de gripe y la opinión pública mediante el uso de los datos a disposición del público por una cantidad ingente de usuarios de Internet y de telefonía móvil. Estas huellas digitales dejadas por los pueblos del mundo, ya que utilizan la Internet y los teléfonos móviles para interactuar por Internet, buscar información,

conectarse con otras personas y jugar en línea. Este conjunto de datos es lo que le llaman los “big data”. Es la primera oportunidad para que muchas de las ciencias sociales para trabajar con una cantidad de estadísticas detalladas que rivaliza e incluso supera los conjuntos de datos de, por ejemplo, la física de partículas o la astronomía.

Al igual que el pronóstico del tiempo se hace más preciso con mayor número de sensores, así los equipos de computación y análisis han mejorado, por eso los pronósticos del “clima” de la sociedad será de corte científico.

La analogía con el mapa del tiempo funciona a varios niveles. El valor real de los mapas del tiempo no está en ver los patrones climáticos, sino las posibles “tendencias”. Por eso, cuanto más macroscópico sea la focalización del mapa, más capaces seremos de ver las tendencias. Del mismo modo, muchas de las amenazas a las que nos estamos enfrentando en este siglo como son el terrorismo, el caos financiero, las epidemias, podrían ser mejor vistas (sus insights) de antemano si tuviéramos una especie de mapa del tiempo a nivel macro de la sociedad.

Observaciones individuales acerca de dónde vive alguien o la salida de una pequeña empresa no suele decir casi nada sobre las grandes tendencias. No se puede ver el tamaño y la forma de una tormenta al examinar unas gotas de lluvia, de manera similar, usted no puede ver grandes cambios en la economía o la sociedad por buscar sólo en sus otros vecinos o compañeros de trabajo. Sin embargo, un gran número de estos puntos de datos pueden mostrarnos los patrones a gran escala.

El Internet se ha utilizado para grandes oportunidades de negocio, como un depósito de todo conocimiento humano, como el medio de la colaboración de todo el

mundo y como la mejor herramienta del diálogo público. Sin embargo, vemos que hay un deficit en la propia Internet, ya que es casi totalmente subutilizada como un instrumento de medición de la sociedad. El principal método de seguimiento de las grandes tendencias en la sociedad sigue siendo el estudio y, en el caso de los negocios, el sistema de informes financieros. Negocios y gobiernos a entender la importancia de la utilización de estas encuestas tradicionales para informar a las estrategias críticas. En 2002, el Gobierno de los EE.UU. era el único gasto de más de $4 mil millones por año en las encuestas para medir la economía y otros aspectos de la sociedad. El sector comercial se gasto alrededor de $15 mil millones por año en el mismo.

Los métodos tradicionales de encuestas implican estudia cuidadosamente diseñado que permite un análisis estadístico sencillo. Desafortunadamente, son costosos, lentos, y aún con las metodologías, a menudo riguroso no captan lo que está sucediendo realmente. Ellos están plagadas de las tasas de respuesta pequeños, y en algunos casos lo que se dice en las encuestas tiene poco que ver con la realidad. Estos métodos suelen tardar semanas o meses para que el informe se termine, muchas veces esto es mucho después de que los datos hubieran sido útiles.

Internet es ya en muchos órdenes de magnitud más grande que todos los datos recopilados por los gobiernos y las empresas que utilizan las encuestas tradicionales.

La red social Facebook procesa por día 25 terabytes de datos. Esto es aproximadamente 1.000 veces la cantidad de datos por correo electrónico de EE.UU. La encuesta más grande del mundo-Censo de los EE.UU. produce menor cantidad de datos que esta en una década. En 2010, el servicio de microblogging de Twitter dio a la Biblioteca del Congreso 167 terabytes de datos que representan más de 6 mil millones de “tweets”. Y estas fuentes aún sólo forman parte de los datos digitales públicamente visibles que dejamos atrás.

Los datos de Internet son, por supuesto, no estructurados y en algunos aspectos más difíciles de analizar que una encuesta especialmente diseñada para evaluar determinado comportamiento. Afortunadamente, los nuevos métodos para el análisis de estos datos científicos están evolucionando, incluso cuando el volumen de datos continúa creciendo a un ritmo endiablado. El registro digital de carácter colectivo y de datos interaccionados para ver nuestro comportamiento ha crecido hasta un punto en que puede reflejar algo útil acerca de los usuarios del sistema. Ahora podemos ver el equivalente del mapa del tiempo que depara la opinión pública (trend topics), la economía, nuestra salud y nuestras ansiedades.

Por todo ello, el autor intenta ponerle nombre a esta ciencia en proceso emergente. Habla de análisis de datos sociales, de cibersociología, de huella digital, de psicohistoria (retomando el concepto de Isaac Asimov), pero el que más le convence (por lo llamativo del término) es el de “La revolución de los datos sociales” [slides y web]. Por todo ello, podemos definirlo el término revolución social de Datos (RSD) como el cambio en los patrones de la comunicación humana (en la que conjugan en la comunicación virtual. Podemos decir que por primera vez en la historia la comunicación puede ser de “todos a todos”) hacia un mayor intercambio de información personal y sus implicaciones relacionadas, hecha posible por el auge de las redes sociales en la primera década de este siglo. Mientras que las redes sociales se utilizaron en los primeros días para compartir fotos en privado y mensajes privados, la tendencia posterior de la gente es el intercambio de información personal de manera más amplia se ha traducido en cantidades sin precedentes de información pública. Y esto mezclado con la geolocalización hace posible nueva evolución en la generación de redes sociales.

Esta fuente de datos de gran tamaño y actualizada con frecuencia se ha descrito como un nuevo tipo de instrumento científico de las ciencias sociales. Varios investigadores independientes han utilizado los datos sociales para hacer un “nowcast” (como si se tratara de una predicción meteorológica a corto plazo, pero aquí es en lo social, con la amalgama de datos del contexto que queremos analizar) y prever las tendencias tales como el desempleo, los brotes de gripe, los gastos de viajes y opiniones políticas de una manera mucho más rápida, más precisa y más baratos que los informes estándar del gobierno o las encuestas de Gallup, por ejemplo.

En este vídeo da las claves de lo entiende por “Social Data Revolution”:

La muerte del intelectual tal como lo conocemos según Nicholas Carr

Superficiales ncarr
¿Qué tipo de intelectuales implican las redes sociales e Internet, en sentido amplio? Es cierto o es polémico lo que describe Nicholas Carr en libro “Superficiales: ¿Qué está haciendo Internet con nuestras mentes? ” y nuestra generación que se encuentra entre dos aguas creo que estamos viviendo el proceso de transformación en nuestras propias carnes. Lo que es cierto es que como toda herramienta tecnológica que opera en el ámbito cognitivo hace florecer unas habilidades y competencias y desaparecen otras o se convierten estas en mínimos. La neuroplasticidad de nuestro cerebro hace que esto no sea un hecho irreversible en nuestras conexiones sinápticas. Aquí va la referencia de N Carr:

Dada la plasticidad de nuestro cerebro, sabemos que nuestros hábitos online continúan reverberando en el funcionamiento de nuestras sinapsis cuando no estamos online. Podemos suponer que los circuitos neuronales dedicados a explorar, filtrar y realizar múltiples tareas se están ampliando y fortaleciendo, mientras que los que utilizan para leer y pensar profundamente, con una concentración sostenida, se debilitan o erosionan. En 2009 investigadores de la Universidad de Stanford encontraron indicios de que este cambio pueda estar ya en marcha. Le dieron una batería de test cognitivos a un grupo de usuarios habituales de la multitarea, así como a otro grupo de usuarios multitarea comparativamente esporádicos. Encontraron que los usuarios multitarea habituales se dejaban distraer mucho más fácilmente por “estímulos irrelevantes del entorno”, tenían un control significativamente menor sobre el contenido de su memoria de trabajo y, en general, eran mucho menos capaces de mantener concentración en una tarea concreta. Mientras que los usuarios multitarea infrecuentes demostraron un control relativamente fuerte “de la atención de arriba abajo”, los habituales demostraron “una mayor tendencia al controlar su atención de abajo arriba”, lo cual sugería que “podrían estar sacrificando el rendimiento en la tarea primaria para dar cabida a otras fuentes de información”. Los usuarios multitarea intensiva son “pastos de irrelevancia”, comentó Clifford Nass, catedrático de Standford que dirigió la investigación[...]. Michael Merzenich ofrece una evaluación aún más sombría. Al realizar simultáneamente varias tareas online, dice, “entrenamos nuestros cerebros para que presten atención a tonterías”. Las consecuencias para nuestra vida intelectual puede demostrarse funestas.

Las funciones mentales que están perdiendo la “batalla neuronal por la supervivencia de las más ocupadas” son aquellas que fomentan el pensamiento tranquilo, lineal, las que utilizamos al atravesar una narración extensa o un argumento elaborado, aquellas a las que recurrimos cuando reflexionamos sobre nuestras experiencias o contemplamos un fenómeno externo o interno. Las ganadoras son aquellas funciones que nos ayudan a localizar, clasificar y evaluar rápidamente fragmentos de información dispares en forma de contenido, las que nos permiten mantener nuestra orientación mental mientras nos bombardean los estímulos. Estas funciones son, no por casualidad, muy similares a las realizadas por los ordenadores, que están programados para la transferencia a alta velocidad de datos dentro y fuera de la memoria. Una vez más, parece que estamos adoptando en nosotros mismos las características de una tecnología intelectual novedosa y popular. [...]
La Red nos ofrece un acceso instantáneo a una biblioteca de información sin precedentes por su tamaño y alcance, y nos facilita su ordenamiento: encontrar, si no exactamente lo que estábamos buscando, por lo menos algo suficiente para nuestros propósitos inmediatos. Lo que la Red disminuye es el primer tipo de conocimiento al que aludía Johnson: la capacidad de conocer en profundidad una materia por nosotros mismos, construir con nuestra propia mente el rico y peculiar conjunto de conexiones que alumbran una inteligencia singular.

(p. 174-176)

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.

Primer libro sobre el concepto 2.0 en 2002

Estoy leyendo ahora un libro especial. Se trata de la primera referencia o libro al concepto 2.0 se produjo en junio de 2002 cuando la editorial Aspatore Books publicó “Web 2.0: The Future of the Internet and Technology Economy and How Entrepreneurs, Investors, Executives & Consumers Can Take Ad (Execenablers)” por Dermot A. McCormack. Unos meses más tarde (octubre de 2002) se cambió el título a “Web 2.0: 2003-2008 AC (After Crash) cuya portada pongo a continuación:

Portada del libro

El texto de la contraportada es bastante significativo:

“Web 2.0, escrito por el líder visionario de la tecnología Dermot McCormack, esboza el futuro de la economía de Internet y la tecnología y cómo los empresarios, inversionistas, ejecutivos y los consumidores pueden tomar antes de las oportunidades. ¿Cree que la economía de Internet y comercio electrónico están muertos? ¡Está equivocado! La primera fase de la economía de Internet ha terminado con la dramática caída de los mercados, sin embargo la segunda fase (Web 2.0) está simplemente comenzando e irá cobrando forma con mucha prudencia durante los próximos años. En este libro, Dermot McCormack, define claramente las tendencias específicas, retos y oportunidades para las empresas, los consumidores, el mercado de valores y los empresarios. Una lectura crítica de cada director general, ejecutivo, inversionista, consultor, empresario y cualquiera interesado en sacar provecho a nivel profesional o personal en la siguiente fase de la Internet y la economía de la tecnología.”

O sea, que yo soy de los que piensa que el límite fundacional de la web social no está en ese artículo del 30 de septiembre de 2005 por Tim O’Reilly.

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.

Referencias y citación en los libros electrónicos o ebooks

Los libros electrónicos suelen tener otro formato en el que convierte el formato clásico de papel en un archivo electrónico, con lo cual a la hora de citar y referenciar con exactitud se convierte en un problema. Me he encontrado con un post con título explícito de ¿Por qué es tan difícil citar un párrafo en Kindle? en Edukindle:

Por ejemplo, al citar un archivo, con respecto al dispositivo Kindle, la cita podría tener este aspecto:

Stephen, Levitt D. Freakonomics. Rev. and Expanded ed. New York: Harper Collins, 2006. Kindle file

La APA incluso abordó esta cuestión en su blog el año pasado, diciendo en parte:

Para la lista de referencia de entrada, tendrá que incluir el tipo de versión e-book que se lee (dos ejemplos son la versión Kindle DX y la versión de Adobe Digital Editions). En lugar de información sobre la editorial, DOI incluyen el libro o en la que descargó el ebook, si no hay DOI:

Gladwell, M. (2008). Outliers: The story of success [Kindle DX version]. Retrieved from Amazon.com.

El Manual de Estilo Chicago se mantiene bastante simple, podría ser así una referencia:

Thomas H. Davenport and John C. Beck, The Attention Economy: Understanding the New Currency of Business (Harvard Business School Press, 2001), Kindle e-book.

Por supuesto, no hay ninguna razón para ayudar a la persona a quien le gustaría encontrar la fuente de su citación mediante la inclusión de números de ubicación, o, como sugiere APA, con las características estructurales del propio texto que no cambian de formato, por ejemplo como las secciones o capítulos:

Para citar en el texto, ya sea (a) la paráfrasis, evitando así el problema (por ejemplo, “Gladwell, 2008″), o (b) utilizar las directrices de la APA de citas directas de los materiales en línea sin paginación (véase la Sección 6.05 del manual APA). Nombre de las secciones principales (capítulo, sección y número de párrafo; abreviar si los títulos son largos), como lo haría si estuviera citando la Biblia o Shakespeare.

El libro de Gladwell ha numerado los capítulos, y está numerado las secciones de los capítulos. Un ejemplo de cita directa podría ser la siguiente:

Uno de los puntos principales del autor es que “la gente no se levantan de la nada” (Gladwell, 2008, capítulo 1, sección 2, párr. 5).

Es interesante lo que ocurre con el problema de la citación apropiada en un libro de Kindle cuando lo llaman por su nombre: un archivo.

El futuro de la Universidad

Portada del libro

Según A. Pulido, en su reciente libro sobre “El futuro de la universidad: un tema para debate dentro y fuera de las universidades” en la editorial Delta Publicaciones y accesible en pdf en Univnova. En el capítulo 9 establece los escenarios del futuro con respecto a una visión plural de diferentes universidades y proyectos:

El cambio de una institución como la Universidad debe realizarse con una visión a largo plazo, aunque las actuaciones sean urgentes. El mayor problema es que anticipar evoluciones a 10-15 años no es factible, con un mínimo de solvencia, dado el amplio número de factores condicionantes. La solución técnica consiste en enfocar el problema como un ejercicio de imaginación (con bases lo más sólidas posibles) en lugar de como una predicción con la que se intenta “acertar” un futuro tan incierto. La consecuencia de este enfoque prospectivo es que los futuros que podemos imaginarnos (con cierto realismo) son múltiples. En términos más precisos, el objetivo es diseñar escenarios de futuro, explicitando las fuerzas del cambio, los condicionantes y las estrategias alternativas para caminar hacia los escenarios más adecuados.
De un análisis de veintinueve escenarios posibles hacia el 2020, diseñados por siete instituciones de diferentes países, hemos entresacado algunos rasgos comunes que nos permiten diseñar cuatro futuros posibles para las universidades. Por supuesto, la realidad de cada universidad será una mezcla de la posible evolución de su entorno (regional, nacional e internacional) y de su estrategia de respuesta. La tipología que se expone a continuación señala algunas alternativas relativamente extremas, pero que creemos ayudan a plantear opciones de futuro.
Las cuatro alternativas seleccionadas son las siguientes:
1. Universidad tradicional sin cambios.
2. Universidad tradicional adaptada.
3. Universidad con estrategia nacional/local.
4. Universidad con estrategia global.