No existe tal cosa como “datos malos”

De pronto, en el contexto de datos abiertos, surge la duda respecto a qué hacer respecto a los “datos malos”.

Hay una única respuesta: nada.

La razón es que no existe tal cosa como “datos malos”.

Para explicar por qué es necesario considerar a qué se refiere la gente usualmente con esa expresión. Posiblemente “datos malos” es una traducción demasiado literal de “bad data”, por lo que la forma más correcta en Español es “datos malévolos”. En esa forma se refiere a datos con los cuales alguien podría hacer algo malo. Y ahí está la respuesta: no existen datos malos, lo que existe son malos usos de los datos. El ejemplo inmediato es el robo de identidad. Si se encuentran disponibles suficientes datos sobre una person, es posible utilizarlos para suplantar su identidad ante un tercero.

El robo de identidad también ayuda a revelar otro problema con la noción de “datos malos”. Para convencer a un banco de que usted es yo no es suficiente con únicamente mi password ó mi fecha de cumpleaños ó mi nombre ó mi dirección ó el número de mi tarjeta de crédito. La mayoría de bancos implementan políticas de seguridad relativamente pobres, y si bien no se dan por satisfechos si yo les doy solo uno de esos datos al teléfono, muchos sí se dan por satisfechos si les doy todos esos datos. En otras palabras, cada uno de esos datos por sí solo no es “malo”. Lo “malo” serían todos esos datos en conjunto, ¿pero cómo puede algo no ser malo aislado, pero serlo cuando se encuentra junto a otras cosas que tampoco son malas por sí solas? La analogía más evidente es que ni la harina, ni el azúcar, ni la mantequilla, ni los huevos son malos. Lo que es malo para mi organismo es hacer un pastel con todo eso y comérmelo todo de una vez. ¿Deberíamos por eso hacer imposible el acceso a la harina, el azúcar, la mantequilla y los huevos?

No hay “datos malos”, hay “malos usos de los datos”.

Esto son (casi) datos abiertos

El artículo anterior fue relativamente sencillo de escribir, pues lo hice todo mal:

  • No expliqué qué representa la imagen
  • No indiqué qué datos fueron utilizados para crear esa imagen
  • No expliqué cómo obtuve esos datos
  • No expliqué qué simplificaciones y reducciones apliqué sobre los datos utilizados
  • No expliqué en forma alguna cómo pasar de los datos a la imagen

En otras palabras, lo único que hice fue crear una imagen con muchos colores y mover las manos en el aire suficiente como para causar la impresión de que la imagen es importante y contiene información que es importante considerar.

La imagen en cuestión es esta:

¿Qué es esta imagen?

Al final del artículo decía yo que “tiene que ver con las personas que participaron de #OGPSanJose”. La afirmación es bastante literal: cada nodo en la imagen corresponde a un usuario de Twitter que en algún momento (posiblemente reciente, pero no hay una limitación explícita al respecto, solo aquellas que impone el API de Twitter) escribió un tweet con la palabra “OGPSanJosé” o alguna variante de eso (OGPSanJose, ogpsanjosé, etc), incluído pero no limitado al hashtag #OGPSanJosé. Los enlaces entre los nodos se establecen sí y solo sí los usuarios correspondientes se siguen mutuamente (no es suficiente con que un usuario siga al otro, ambos deben seguirse uno al otro). Los colores y los tamaños de los nodos están dados por la cantidad de enlaces ingresando a cada uno, en otras palabras, mientras más grande y más rojo sea un nodo, más enlaces tiene con otros nodos y mientras más pequeño y más azul, tiene menos. O en otras palabras: el grado de conexión entre los usuarios. Los colores de los enlaces existen únicamente para hacer la imagen más agradable a la vista. La distribución espacial de los nodos busca que las conexiones sean más sencillas de entender, pero no aporta ninguna información adicional.

Primer principio fundamental de datos abiertos: explique qué son los datos que está publicando.

La anterior es una explicación seca del contenido de la imagen. No hay interpretación y no hay opiniones respecto a la imagen. No tengo duda que un periodista quitaría más del 80% de las palabras y cambiaría otras tantas. Sin embargo contiene información que es valiosa para alguien que quiera repetir el ejercicio. Igualmente contiene información valiosa para derivar alguna conclusión de la imagen. Repetir el ejercicio es parte integral de la noción de datos abiertos, pero realizar interpretaciones y sacar conclusiones es una actividad que trasciende el tema.

Para poner esto en contexto, yo puedo por ejemplo abrir el periódico, buscar alguno de los infogramas que casi con seguridad contiene, leer el artículo respectivo y tratar de sacar mis propias conclusiones a partir de toda esa información. El periodista habrá indicado alguna fuente, usualmente limitándose al nombre de la institución que produjo los datos (e.g. MICIT, CONICIT) y en algunas ocasiones indicando el nombre de un informe o trabajo de investigación que los contenga o los haya producido (e.g. “adjudicación de becas de grado en el año 2014″). Solo en rarísimas ocasiones indicará una fuente inequívoca para los datos asociados (por ejemplo un enlace a la fuente original, o un archivo que los contenga), y en ocasiones aún más raras indicará un procedimiento que se pueda emplear en la práctica y que permita a algún lector reproducir el trabajo requerido para, partiendo de los mismos datos, llegar a la misma información.

Segundo principio fundamental de datos abiertos: publique los datos.

(y sí, estoy consciente de que mucha gente opinará que este debería ser el primero; yo difiero)

Un paso en la dirección correcta es entonces publicar al menos un archivo (o servicio de consulta) para los datos requeridos para reproducir un gráfico o infograma. Publicar los datos sin embargo no es suficiente. Por ejemplo, en el post anterior yo señalaba que esto correspondía a los datos para la imagen en cuestión. El archivo está comprimido con un programa ampliamente disponible, pero posiblemente no ampliamente utilizado. Una forma quizás más amigable, pero que igualmente tiene su cuota de problemas, es por ejemplo esta. Es el mismo contenido, solo cambia la forma. El archivo no ofrece grandes explicaciones respecto a qué son las columnas de las tablas, aunque no hay nada que evite tal cosa. La hoja electrónica sí contiene esa información.

Tercer principio fundamental de datos abiertos: publique los datos en una forma tal que otras personas los puedan acceder.

Ya he indicado varias veces que estos no son los datos originales. En ese archivo hay poco más de 4000 filas. El conjunto de datos original tiene más de 250 mil. Este es un problema usual a la hora de abrir datos: lleva un costo asociado, pues como mínimo alguien tiene que pagar la distribución de los archivos. Alguien además tiene que preparar los datos, que también tiene un costo, y alguien tiene que mantener los datos, que también tiene un costo. Menos evidente: una vez que se publican datos, se debe hacer todo lo posible para mantener cada una de las versiones de los archivos publicados en línea, pues habrán documentos en la web que hagan referencia a las versiones antiguas. El corolario que es los archivos con los datos deben tener alguna forma de identificar la versión de los mismos. En otras palabras: no sobreescriba los archivos para actualizarlos, déles un nuevo nombre.

Cuarto principio fundamental de datos abiertos: incluya el costo de la publicación y mantenimiento en su planeamiento.

Superado el problema del costo, todavía queda abierta la pregunta de la reducción. Es sumamente tentador publicar datos reducidos, pues elimina dos “problemas”.

El primero es que quien reciba los datos puede carecer del conocimiento o la experticia para realizar la reducción por cuenta propia. Es decir, la labor de reducción de los datos va plagada de buenas intenciones y las buenas intenciones todos sabemos a dónde llevan. Si esa es su única motivación, resista la tentación de hacer eso.

El segundo problema que se resuelve al reducir los datos publicados es que se cierra la posibilidad de que alguien reproduzca el proceso y encuentre errores o problemas. Por extraño que esto suene, mi experiencia es que existen personas y organizaciones que reducen los datos publicados exactamente con este objetivo. Un ejemplo llevado al absurdo es el caso de una oficina que en lugar de indicar que se compraron dos millones de colones en lápices, cincuenta mil colones en papel y cincuenta mil colones en grapas, en su presupuesto “abierto” indica simplemente que se compraron dos millones cien mil colones en “insumos de oficina”.

En el caso ideal, la información se publicaría individualizada, es decir, en lugar de indicar el monto total que se usó en lápices, se indicarían los montos para cada compra realizada. Es diferente realizar una compra de dos millones de colones vs veinte compras de cien mil, incluso si el total es el mismo. En un reporte individualizado podría indicarse por ejemplo la fecha (que permitiría derivar patrones); se podría incluir información sobre el proveedor; se podría incluir información sobre marcas; se podrían incluir muchas otras cosas que mejorarían las labores de control.

Antes ejemplificaba con periodistas porque es el ejemplo más común de esta situación, pero lo mismo aplica para (interpretaciones de) datos publicados por instituciones u organizaciones de la más variada índole. Por ejemplo, en el contexto de #OGPSanJosé existe este tweet:

Data Meic, el portal de #DatosAbiertos del Ministerio de Economía de Costa Rica. #OGPSanJose. Cc @EconomiaBo http://t.co/bW0TPxvcIQ

— Badanowski (@jbadani) noviembre 18, 2014

En la página web indicada (cuando se puede acceder), se encuentra uno con información altamente reducida y procesada. Por ejemplo, hay un listado de “empresas PYME por región según sector económico”. ¿Por qué no publican una tabla con todas las empresas, con una columna que indique el tipo de empresa (micro, pequeña, mediana, grande) y los sectores económicos donde se desempeña cada una? De algo así se podría derivar muy sencillamente la información que sí publican.

Quinto principio fundamental de datos abiertos: publique los datos de manera desagregada.

En el ejemplo que yo construí, la reducción que ocurrió entre el conjunto de datos grande y el pequeño es que el primero incluye todos los seguidores de todos los usuarios que publicaron usando el hashtag #OGPSanJosé. El conjunto pequeño incluye solo los seguidores que también publicaron usando el mismo hashtag. Es decir, en lugar de ver el universo de todos los seguidores de los usuarios (presuntamente) interesados en #OGPSanJosé, se ve el universo de los seguidores que también están interesados en el tema. La reducción tiene por objetivo identificar la estructura de la comunidad, si es que existe alguna, de los usuarios suficientemente interesados en el tema como para 1) escribir un tweet (contrario a solo retuitear) sobre el tema y 2) identificarlo con el hashtag respectivo. Puede haber gente moderadamente interesada en el tema, que nunca publica nada al respecto y se limita a marcar tuits como favoritos y retuitearlos. Esos usuarios observan a la (posible) comunidad, pero no son parte activa de la misma.

Y en esa última oración, inevitablemente, hay interpretación de la realidad.

Sexto principio fundamental de datos abiertos: si va a aplicar reducciones, explique cuáles y por qué.

¿Por qué digo que estos son datos casi abiertos?

Por dos motivos.

El primero es que los datos provienen de efectuar miles de consultas utilizando el API de Twitter. Al publicar estos datos en esta forma es posible que esté caminando sobre una línea muy delgada entre lo que la licencia de acceso al API permite y no permite hacer. Eso hace que la redistribución de los datos no esté tan libre de restricciones y ataduras como idealmente debería estarlo. Estoy seguro que puedo publicar los datos que estoy publicando precisamente porque son una colección de números sin sentido. No estaría tan seguro si estuviese publicando tweets, nombres de usuarios y otros datos asociados.

El segundo problema es que los datos provienen de efectuar miles de consultas utilizando el API de Twitter. Es perfectamente posible que si alguien reproduce este trabajo no obtenga exactamente los mismos datos, por un lado porque ya ha pasado tiempo desde que yo los obtuve (entre el 10 y el 14 de noviembre), y por otro lado porque la visibilidad de la información variará según quien haga la consulta (cuentas que no son públicas, diferentes formas de usar el API, etc). En otras palabras, la reproducibilidad de estos datos es cuestionable.

También es necesario señalar que es posible que todavía esté omitiendo información importante respecto al proceso, pero me interesa más el fondo del asunto que la forma.

No pretendo con esto dar una definición exhaustiva de qué son datos abiertos, ni enumerar todos los posibles factores que es necesario tomar en cuenta al publicarlos. Pretendo sin embargo poner una luz más en el camino para que tal cosa ocurra en una manera que sea útil y provechoso para todas las partes involucradas, específicamente en la situación donde se casa esto con el tema de Gobierno Abierto. Es sumamente tentador publicar tablas esencialmente aleatorias de datos y levantar la bandera de Gobierno Abierto. Es sumamente tentador asignar la tarea al recién llegado que menos entiende del tema. Es sumamente tentador conseguir financiamiento para montarse en el avión y participar en cuanta conferencia exista del tema para luego venir a presentarse como experto y pionero del tema. Es sumamente tentador establecer “alianzas” con empresas (que entienden que este es un negocio que no se acaba cuando cambie el gobierno de turno) con la finalidad de “acelerar” el proceso y “aprovechar las experiencias de otras latitudes”. Es sumamente tentador recurrir a la red social con las que nos sentimos más a gusto y a la gente que nos lleva tal vez solo uno o dos pasos de ventaja, e ignorar completamente a todos aquellos que van kilómetros por delante, con quienes tal vez no tenemos ninguna relación.

Son demasiadas tentaciones juntas. Estamos en un buen momento para evaluar críticamente si lo que estamos haciendo va por el camino correcto o no. Es también un buen momento para producir y publicar un plan que indique a dónde queremos llegar y cómo queremos llegar ahí.

PS: Para los curiosos: la imagen la produje usando Gephi luego de tomar los archivos indicados antes y procesarlos suficiente como para que el programa los pueda consumir.

Esto no son datos abiertos

El otro día, leyendo opiniones de diversa gente respecto a las bondades de los datos abiertos, hice esto:

Esto no son datos abiertos. No son datos (al menos no si uno supone que esto es una representación visual de un conjunto particular de datos, y no simplemente una colección de bytes que casualmente el navegador web interpreta como una imagen). Tampoco es información. Esto es, si acaso, lo que en el instituto llamábamos despectivamente una “imagen colorida”. Y sin embargo muchas veces algo equivalente a esto se hace pasar por datos abiertos.

Esto tampoco son datos abiertos. Eso es una colección de números sin sentido. Alguien podría imaginarse como pasar de ese archivo a la imagen de arriba. Alguien incluso podría imaginarse más detalles para lograr algo mucho más parecido a la imagen de arriba. Alguien que profesionalmente haga algo relacionado con áreas muy particulares del conocimiento podría incluso llegar a desarrollar una teoría respecto a qué es el contenido del archivo y cómo es que está organizado. Ese alguien podría seguramente tener una idea más clara de cómo llegar del archivo a la imagen, e incluso posiblemente podría darle sentido al tamaño y el color de los círculos.

Lo que no podría hacer es reconstruir exactamente la base de datos de la cual fue extraído ese archivo. Podría imaginarse como construir esa base de datos, y posiblemente alguien podría tener exactamenete la misma idea que yo tuve, e implementar un programa que obtenga los mismos datos de la misma fuenta. Digo “posiblemente” y no “seguramente” no porque crea que mi idea es única y especial, sino porque es mi idea. Otra persona queriendo obtener la misma información podría perfectamente tomar una ruta diferente y llegar a un sitio muy parecido.

Más importante que eso es el hecho que para pasar de la base de datos original al archivo indicado arriba, hubo datos que fueron destruídos por el simple hecho de que yo creí que no eran relevantes para el problema en cuestión. De hecho la destrucción de datos ocurrió precisamente con la finalidad de reducir la cantidad de ellos, para que la imagen de arriba tuviese al menos un chance remoto de tener algo de sentido. Al destruir parte de los datos yo tenía buenas intenciones. Admito que en los datos destruídos hay cosas interesantes, pero lo que yo creía que era la parte más útil es la que preservé. Alguien más podría tener una idea completamente diferente y llegar a conclusiones mucho más elucidantes que las mías.

¿Podría publicar la base de datos original? Sí, podría. Pero tengo incentivos para no hacerlo. En este caso específico el incentivo principal es ilustrar qué constituyen datos abiertos y qué no, y ejemplicar los problemas que resultan cuando alguien decide “limpiar” y “reducir” los datos. Un incentivo secundario es que ese archivo es grande. Dado que el archivo no es la fuente primaria de esos datos, podría publicar el programa que obtiene los datos desde la fuente primaria, pero nuevamente tengo incentivos para no hacer eso.

Eso ilustra un segundo punto, tal vez más sutil que el primero: producir y publicar los datos requiere de cierto nivel de experticia, no es solo “soplar y hacer bombitas”. Convertir esos datos en información también requiere un nivel de experticia, posiblemente de un tipo diferente al primero, pero experticia de todas formas. Trabajar con esa información, opinar sobre esa información, tomar decisiones con esa información, todo eso puede o no puede requerir experticia,y si la requiere puede ser en áreas muy diferentes una de otra, y puede ser en múltiples áreas que nunca se sobreponen. No es bueno caer en la tentación de confundir la producción de los datos con el consumo de los datos.

¿Quién se atreve a explicar qué es la imagen de arriba? Pista: tiene que ver con las personas que participaron de #OGPSanJosé.

Datos abiertos: experiencias en otras partes

Comentaba yo sobre el divorcio que parecemos tener entre el deseo por un gobierno abierto y (la falta de) datos abiertos, y decía que debemos comprar nuestra experiencia con la de otros sitios.

¿Cuáles han sido experiencias positivas en otros lugares?

Hace un par de años Tim O’Reilly alababa la experiencia en Chicago, narrada elocuentemente por John Tolva, quien señala que establecieron cuatro principios básicos:

La transparencia crea confianza.
La rendición de cuentas crea una mejor fuerza laboral.
El análisis crea nuevos procesos.
Los datos abiertos crean negocios.

Los dos primeros se tienen que ver con gobierno abierto y los dos últimos con datos abiertos. Partir de la conjunción de las cuatro cosas es un buen signo, ya que queda claro que no se puede alcanzar un gobierno abierto sin tener datos abiertos antes, pero también deja claro que no se pueden tener datos abiertos sin tener la intención de llegar a un gobierno abierto.

Las intenciones, por buenas que sean, eventualmente no alcanzan para reemplazar a las acciones. Cualquier iniciativa de gobierno abierto tiene que ir acompañada de una rápida materialización de una política de datos abiertos. Siguiendo con el ejemplo de Chicago, ellos han establecido un portal de datos que contiene toda clase de información y de metainformación. Un conjunto de datos que, comprensiblemente, atrae mucho la atención es el de los salarios anuales de los diferentes funcionarios de la ciudad. Hay sin embargo cosas que alimentan menos la curiosidad, pero que eventualmente podrían ser más útiles, como el listado completo y actualizado de los contratistas trabajando para la ciudad, el listado georeferenciado de las violaciones al límite de velocidad detectadas por las cámaras instaladas para tal efecto ó la cantidad de visitas mensuales a cada una de las bibliotecas públicas. Más importante que todos esos ejemplo es el hecho que la ciudad de Chicago ofrece un API para acceder toda la información de manera programática y en tiempo real. Chicago no solamente publica datos, también los mantiene actualizados. Por ejemplo, el listado de crímenes reportados no es el listado de los crímenes de hace cinco años, o del año pasado, o del primer semestre del año. Es el listado de los crímenes reportados que han ingresado de forma más reciente a la base de datos. Al momento de yo hacer la consulta había información de hace siete días.

La ciudad de Chicago no está sola en este esfuerzo. San Francisco hace lo propio. Puerto Rico también. el Reino Unido. Amsterdam. Berlín. Uruguay. Buenos Aires, la Unión Europea… muchas de estos sitios utilizan Socrata como plataforma de administración datos abiertos y otros utilizan CKAN. Independientemente del sistema, lo que tienen en común estas iniciativas es que tienen clara la importancia de no ser simplemente un sitio con cuadros y gráficos, sino que los datos estén ampliamente disponibles, utilizando interfaces y formatos bien documentados, y que se mantengan actualizados de forma contínua. Socrata ofrece una guía de campo donde explica en términos muy básicos como desarrollar una estrategia de datos abiertos.

El proyecto Ushahidi demuestra que las iniciativas de datos abiertos no son solo cosa de gobiernos. Lo que comenzó como una página web para promover el periodismo ciudadano en Kenia, se ha convertido en toda una plataforma para recoger información de los ciudadanos en tiempo real, pero también se ha desarrollado más allá de eso y provee herramientas para hacer mapas sin intervención o apoyo de un gobierno central, análisis de información, organización de datos de crisis, alertas durante emergencias, un gateway para mensajes de texto e incluso un aparato para mantener la conectividad a Internet en sitios donde de otra forma eso sería difícil o imposible.

Ushahidi no está solo. Existen otras cosas, grandes y pequeñas, por ejemplo Open Parliament es una iniciativa privada para mantener datos y registros de las decisiones del parlamento en Canadá. Fix my street es un sitio en el Reino Unido para reportar problemas a nivel comunitario, que se desarrolló en una plataforma que puede ser utilizada por cualquiera. La fundación Sunlight ofrece mecanismos para que los ciudadanos puedan mantenerse al tanto de las acciones de su gobierno. Hay muchos otros ejemplos de este tipo. De hecho, hay tantos que la idea de la sociedad civil utilizando medios tecnológicos para influir en el gobierno no es solo una idea bonita, es todo un tema.

En todas sus variantes, en el tema de datos abiertos la pregunta ya no es si hacerlo o no, la pregunta hoy en día es cuándo, porque ayer ya es tarde.

Gobierno abierto vs datos abiertos

Cuando Luis Guillermo Solís asumió la Presidencia de la República prometió que el gobierno sería una casa de cristal. La promesa fue seguida rápidamente por el acto simbólico de quitar los arbustos del frente de casa presidencial.

Y ahí se detuvo.

Yo he dicho varias veces que a mi me dicen “gobierno abierto” y “transparencia” y yo me la creo. Eso usualmente conduce a enormes decepciones, pues es muy fácil comenzar en un estado de poca apertura y poca transparencia, hacer un par de cositas simbólicas por aquí y por allá y salir a decir que ya alcanzamos un estado distinto y mejor. Sin embargo es muy difícil reconocer que el camino que falta por recorrer es mucho, que nunca se va a acabar, y lograr dimensionar los anuncios de forma concordante. Es mucho más satisfactorio decir “hicimos esto, y es enorme” a decir “hicimos esto, que es importante, pero entendemos que todavía nos falta todo esto otro.”

Eso es muy curioso, pues la apertura y la transparencia consisten en exactamente eso: no solo decir qué hemos logrado, sino también admitir abiertamente qué es lo que nos falta. Por ello, la primera publicación de cualquier iniciativa de apertura gubernamental tiene que ser una hoja de ruta continuamente actualizada que señale claramente qué es lo que se ha hecho, qué es lo que se planea hacer y qué es lo que es necesario hacer. Se requiere de mucho valor para reconocer la diferencia entre las dos últimas cosas, pues lo necesario es invariablemente más grande que lo planeado.

También es necesario reconocer que la idea de gobierno abierto es enemiga de lo que en Costa Rica conocemos como “patas”, es decir, no se trata solo de un cambio en la forma como se conducen los asuntos públicos, se trata también de una modificación cultural. Eso comienza desde la forma en la que se lleva adelante la iniciativa de gobierno abierto, donde han habido claros personalismos de por medio. Por ejemplo, si uno busca ingenuamente “gobierno abierto” en Costa Rica, llega a una página dentro del sitio web de “Gobierno fácil”. De la poca información que esa página contiene, lo más notable es el plan de acción de gobierno abierto para el 2013-2014. Y no hay nada más allá del 2014. Me atrevo a especular que eso es así porque “ese es el plan de otro, esa es la iniciativa de otro. La iniciativa mía va por otro lado.” Eso, que es cultural, y es algo a lo que le tenemos tantos nombres en nuestra sociedad, eso mina cualquier buena intención de avanzar hacia un gobierno abierto y transparente.

La otra componente que complica las cosas en nuestro medio son los datos abiertos, o mejor dicho la ausencia de ellos.

“Datos abiertos” no es publicar, por ejemplo, un informe, con todos sus gráficos, respecto a una encuesta, como lo hizo en múltiples ocasiones el CIEP durante la pasada campaña electoral. Que el informe esté disponible, que se pueda consultar, y que no haya que pagar para tener acceso a él, todo eso está muy bien, pero eso no son datos abiertos.

“Datos abiertos” tampoco es publicar, como lo hace el Estado de la Nación, por nombrar uno, un tabla donde se toman, por ejemplo, respuestas individuales a una encuesta nacional y se reducen por distrito, es decir, se toman todas las respuestas de un distrito y se juntan para producir una única fila de datos a partir de 20, 50, 100 o quién sabe cuántos datos originales. Para algunas cosas y en algunos casos es algo útil, pero eso no son datos abiertos. El Estado de la Nación también publica algunos de sus conjuntos de datos en formatos propietarios y mal documentados.

“Datos abiertos” tampoco es la grosería que hace el INEC, que es lo mismo que el caso anterior, pero en lugar de reducir los datos originales por distrito, los reducen por provincia, por género, por edad o por quién sabe cuántas otras categorías se les pueda ocurrir, todas amplísimas. Ellos reconocen el valor de los datos originales, por lo tanto uno puede accederlos a cambio de una no tan módica suma. Y para estar claros: datos obtenidos por una institución del Estado, con presupuesto del Estado, que son útiles para actividades en las que el Estado debería estar interesado, son accesibles contra solicitud y pago.

“Datos abiertos” tampoco es lo que hace el TSE, que es un caso muy especial, pues hace muchas cosas muy bien y muchas cosas muy mal. El TSE publica el padrón electoral completo, en un formato fácilmente legible por máquina. Eso es bueno. El TSE no publica los centros de votación de la misma forma. Esto quiere decir que es imposible construir una página web donde la gente pueda consultar si sitio de votación con solo ingresar su cédula. ¿Cómo es posible algo como esto entonces? Usando mecanismos no documentados que están disponibles hoy en día, que imponen una carga innecesaria en los servidores del TSE y que pueden, sin aviso alguno, desaparecer mañana. La otra cosa que el TSE no publica en formatos fácilmente legibles por máquina son los resultados de los procesos electorales que lleva a cabo. Lo que publica es una colección de copias electrónicas de las actas con los resultados en una forma tal que es sumamente engorroso traducirlos a formatos útiles. Igual algunos somos necios y hacemos todo ese proceso engorroso para que otros no tengan que pasar por lo mismo. El TSE tampoco publica la base de datos con la información de nacimientos y defunciones, y si uno la solicita le dan un portazo en la cara. ¿Cómo es posible entonces algo como el juguete con el que muchos se entretuvieron esta semana? Para mi es evidente, por los errores que se cuelan hasta los resultados, que ese juguete utiliza esa base de datos. ¿Si el TSE no la brinda, cómo es posible que exista esa página web? De la misma forma que yo tengo copia de una versión de hace unos años atrás de la misma: patas. Alguien que conozco conoce a alguien que conoce a alguien que tiene acceso a la base de datos, y de salto en salto esos datos terminaron en mi disco duro. ¿Está eso bien? Absolutamente no.

¿Hay alguien en alguna parte del planeta que haga esto bien? ¡Por supuesto! ¡Muchos! Para muestra un botón. Esos archivos contienen cada una de las respuestas brindadas por los entrevistados, junto con la entrevista que se les aplicó. No son los datos reducidos de manera antojadiza, sino los datos originales, tal cual se obtuvieron. Si bien es cierto que contienen la información de dónde se realizó la encuesta, no tienen información de a quién se encuestó. Tampoco estoy tratando de meter diez con hueco: admito que existe la posibilidad, dados los datos que contienen esos archivos, de llegar a identificar a muchos de los encuestados si uno realmente quisiera hacerlo. No digo que es fácil o que es ciertamente posible, pero si digo que con la información suministrada no se puede descartar completamente esa posibilidad. Eso es ciertamente un riesgo a considerar en cualquier circunstancia en la que se publiquen datos realmente abiertos, pero es mi opinión que esa situación es mejor que la alternativa, que queda ilustrada en el caso del TSE mencionado antes: si los datos no están disponibles de forma abierta, siempre existe la posibilidad de que se trafique con ellos por debajo de la mesa, y eso conduce a una situación donde una poca gente tiene acceso y la mayoría no.

La parte más complicada es la confluencia de estas dos cosas: gobierno abierto y datos abiertos. Es mi opinión que es imposible tener lo primero sin lo segundo. Si se considera por ejemplo las sesiones del consejo de gobierno, las actas, adecuadamente anotadas y con referencias cruzadas, constituyen datos. Las actas de cualquier junta directiva igualmente constituyen datos. Las actas de las sesiones de las comisiones de la Asamblea Legislativa constituyen datos. Las actas de todos los organismos que pretenden influir en el desarrollo de lo público constituyen datos. Y sin embargo ninguna de esas cosas está disponible en forma de datos abiertos, incluyendo las de aquellas organizaciones que han prometido públicamente harán lo propio. Menciono actas para dar un ejemplo, pero igual podría haber dicho presupuestos (planeamiento y ejecución), informes de viajes, o tantas otras cosas similares mucho antes de comenzar a pensar en encuestas y similares.

La primera piedra con la que se encuentran las organizaciones que tienen la buena voluntad de construir un gobierno abierto es que mantener datos abiertos es mucho trabajo. Suponiendo que se pudiesen ignorar todas las consideraciones referentes a privacidad e información confidencial, igual es mucho trabajo. Cualquiera puede subir un acta a Google Drive. No cualquiera puede colocar todas las anotaciones y todas las referencias cruzadas a un acta. Es fácil hacer eso una vez. No es fácil hacerlo continuamente.

La segunda piedra es la tentación de utilizar cualquier formato de datos o publicar la información de cualquier forma, o peor aún, de no conservar ninguna consistencia entre una publicación y la siguiente. Publicar PDFs en una página web no son ni datos abiertos ni gobierno abierto. Tiene que ocurrir una clasificación adecuada. Tiene que haber organización de la información. Tiene que haber documentación sobre la información que se presenta. Es cierto, dado que rara vez las organizaciones logran hacer esto bien al primer, segundo y enésimo intento, habemos gente al rededor de todo el mundo que realizamos limpienza y organización de lo que sea que sí publiquen, pero en algún momento hasta uno mismo llega a reconocer que ese tiempo se podría haber invertido mejor que analizar la información y no en tener que limpiarla y organizarla.

También está siempre la tentación de creer que esto es simplemente Politología. O Comunicación. O Sociología. O incluso ninguna de las anteriores. Que acá no es necesario entender de Matemática, de Estadística o de Computación. Que “la parte tecnológica no es primordial”. Peor aún, que “la parte tecnológica se puede ver después.”

La intención de la casa de cristal es buena y se aplaude, pero en algún momento quiero ver que las intenciones se traduzcan en acciones, comenzando por lo que se puede hacer ya. Se puede iniciar por todas esas cosas que no requieren pasar montado en un avión dos años antes de siquiera poder comenzar a pensar en qué hacer acá. Sí, es bonito no saber nada del tema y que lo manden a uno a “aprender” de las experiencias de otros países, ¿verdad? especialmente cuando no existe la obligación (o la intención) de dar un reporte respecto a ese aprendizaje.

No, así no se pueden hacer las cosas.

Ya es hora que pongamos un alto al síndrome de “esto no lo inventé yo” y que veamos seriamente qué es lo que ya hemos hecho acá y qué es lo que han hecho en otros lados, que recojamos lo que se puede recoger y que echemos a andar rápidamente las cosas que se pueden poner a funcionar rápidamente, al tiempo que se coordinan los esfuerzos en torno al resto.

Aclaración necesaria: la DIS y Mariano

El tema de la DIS ha levantado más roncha de la que esperaba. Yo antes mencioné a Mariano porque su designación como director de la DIS efectivamente causa molestia en mucha gente. El día del traspaso de poderes, yo estaba en el Estadio Nacional. Al finalizar el acto vi comentarios en Twitter respecto a la sorpresiva (y silenciosa) designación. Yo pensé que eran chismes malintencionados, más que todo porque Mariano había dicho días antes que no ocuparía ningún puesto en el gobierno. Y ajá, ahí me fuí en la finta. Mariano dijo “gabinete”, no “gobierno”, y, partiendo pelos por la mitad, el director de la DIS no es parte del gabinete…

… con esa partidera de pelos por la mitad sí tengo un problema.

¿Que estrictamente hablando dijo la verdad? Sí, no lo puedo discutir. ¿Que hablando de manera realista mintió? Creo que hay que ser demasiado caradura para negarlo. ¿Ministro de gobierno? Puesto de confianza. ¿Director de la DIS? Puesto de confianza. ¿Mariano de verdad espera que uno vea las cosas como algo distinto nada más porque formalmente hablando, uno es parte del gabinete y el otro no? ¿Usted me está vacilando?

El problema no es si toma el asunto para el vacilón. El problema es que el director de la DIS tiene acceso a información a la que poquísima gente del país tiene acceso. Y puede ser que algún cínico crea que partir pelos por la mitad de esa forma sea una cualidad deseable para alguien que ocupa el puesto, pero yo creo exactamente lo contrario. En Costa Rica no estamos para esas cosas.

Más allá de eso, yo no tengo un problema enorme con que Mariano sea director de la DIS. Respeto, eso sí, que exista gente que desconfía de Mariano en ese puesto, por una multitud de razones.

Dicho eso, yo tengo un problema con que la DIS exista.

Tengo problemas con la existencia de la DIS más allá de los rumores que se utiliza como instrumento para chantaje y extorsión por parte de personas privadas que aparentemente están en posición de “contratar” los servicios de la DIS.

Tengo problemas con la idea de que en Costa Rica se “forme” gente con la mentalidad que urgar en la vida privada de la gente es normal y necesario.

Tengo problemas con la idea de que en Costa Rica exista un cuerpo de “seguridad” que actúa sobre la base de rumores y chismes.

Tengo problemas con la idea de que en Costa Rica exista una policía que no le rinde cuentas a nadie más que al Presidente.

Tengo más problemas con la idea de que en Costa Rica existan funcionarios de gobierno que operan bajo la premisa que no le deben rendir cuentas a nadie más que al Presidente.

Y tengo todavía más problemas con la idea de que esos mismos funcionarios un día de tantos hagan algo que tal vez sea mejor no decirle ni siquiera al Presidente.

Me repugna que haya gente que levanta la bandera del derecho a la privacidad y los derechos humanos y sin embargo en este tema se queda callada. O peor todavía, defiende la necesidad de que la DIS exista.

Me repugna más el oportunismo de libertarios, que viendo el error de Luis Guillermo Solís como una invitación, están sembrando duda y miedo en torno a cosas que ni han pasado y que probablemente no vayan a pasar.

Mi problema con la DIS deriva una cuestión básica: la ley está para cumplirla. Cuando existen personas que tienen de alguna forma permiso para no cumplir la ley, ahí comienzan todos nuestros problemas. En los últimos cuatro años a mi me tocaba por las tardes ver a menudo en circunvalación una caravana de vehículos con vidrios completamente negros, sin placas, circulando muy por encima del límite de velocidad, viajando de Zapote hacia Escazú. Nunca supe a ciencia cierta quién iba en esos vehículos, pero tenía mis sospechas. Yo espero, yo quiero, que este gobierno nunca tenga que ver vehículos haciendo lo mismo de Zapote a Barrio Escalante.

Por eso quiero ver el cierre de la DIS.

Contactos de diputados 2014-2018

Ocasionalmente a este blog llega gente buscando información sobre los diputados electos en las más recientes elecciones. Google por alguna razón considera que esta es una mejor fuente de información que los sitios web donde esa información se encuentra disponible.

Por ello puse toda la información (nombres, email, partido, provincia) en una hoja electrónica de Google Docs. La hoja permite filtrar y ordernar, así que debería facilitar encontrar a los diputados de un partido político, de una provincia particular, o de ambos. Sobra decir están todas las provincias (Alajuela, Cartago, Guanacaste, Heredia, Limón, Puntarenas, San José) y todos los partidos (PAC, PLN, PUSC, FA, PASE, RN, RC, PADC).

¡Espero que sea útil!

Actualización 15/05/2014: Querido Google. Este post contiene información para conseguir los correos electrónicos de los diputados de cada una de las provincias y cada uno de los partidos políticos representados en la Asamblea Legislativa de la República de Costa Rica para el periódo 2014-2018. Por favor dejá de mandar a la gente al post de hace cuatro años. Gracias.

¿Qué es la DIS?

El nombramiento de Mariano Figueres como director de la DIS ha causado molestia. Parte de la molestia se debe a que el PAC en su programa de gobierno para el 2010 incluyó “cierre de la Dirección de Inteligencia y Seguridad”. Cuando Luis Guillermo presentó el programa de gobierno para el 2014, dijo:

estaba todo aquí, en el mejor plan de gobierno que tuvo Costa Rica en el 2010 y lo dejamos ir. La buena noticia es que el mejor plan sigue aquí.

En Twitter alguien le contestó el anuncio diciendo:

@luisguillermosr 10. Cierre de la Dirección de Inteligencia y Seguridad.
:D :D :D :D que no solo los altos políticos se beneficien de la DIS

Eso de “10. Cierre de la Dirección de Inteligencia y Seguridad.” se refería a que ese plan incluía en la parte de seguridad el cierre de la DIS, igual que el del 2010, pero la versión que se encuentra hoy en línea llega solo al punto seis. Cuándo cambió no tengo idea y creo que no importa. Lo que sí importa es que de una campaña a otra ese punto desapareció.

¿Por qué algo aparentemente tan pequeño causa tanto barullo? ¿Qué es la DIS?

De acuerdo con la Ley General de Policía, en su artículo 13:

Créase la Dirección de Inteligencia y Seguridad Nacional, como órgano informativo del Presidente de la República, en materia de seguridad nacional. Funcionará bajo el mando exclusivo del Presidente de la República, quien podrá delegar, en el Ministerio de la Presidencia, la supervisión del cumplimiento de las funciones de este cuerpo policial.

Entre sus atribuciones están:

a) Detectar, investigar, analizar y comunicar al Presidente de la República o al Ministro de la Presidencia, la información necesaria para prevenir hechos que impliquen riesgo para la independencia o la integridad territorial o pongan en peligro la estabilidad del país y de sus instituciones.

y también:

d) Informar a las autoridades pertinentes del Poder Judicial, de la amenaza o la comisión de un delito y trabajar coordinadamente con esos cuerpos, para prevenirlo o investigarlo.

La ley indica que “la Dirección de Inteligencia y Seguridad Nacional no podrá dirigir allanamientos, realizar interrogatorios, emitir citatorios ni participar en detenciones. Por su especialización técnica y si un caso lo justifica, esa Dirección podrá participar, junto con las autoridades que realizan acciones coercitivas, para brindarles información o colaboración. No obstante, esa intervención deberá autorizarla el juez respectivo.” La ley indica además que todos los documentos de la DIS son confidenciales, y si el presidente así lo dispone, se pueden convertir en secreto de Estado.

A partir de la ley que crea la DIS, esta existe con la finalidad de mantener al Presidente de la República informado sobre asuntos que puedan afectar la “seguridad nacional” (sea lo que eso sea). Debe prevenir que se cometan hechos que pongan en riesgo la “estabilidad” del país, pero no puede actuar directamente en la prevención de esos hechos. Yo a eso le llamo peligro para los cuidadanos, pues un organismo que tiene como misión prevenir cierto tipo de situaciones, pero que físicamente no puede hacer nada al respecto es un organismo que solamente puede hacer una cosa: espionaje. Esto se refuerza con el hecho que sus informes son confidenciales, y en caso necesario, secretos de Estado.

El reglamento de la DIS señala que a los funcionarios a los que se les vaya la mano en el ejercicio de sus funciones se le realizará un procedimiento administrativo. Este procedimiento administrativo será secreto para no perjudicar el éxito de las investigaciones.

La DIS cuenta con una dirección; una asesoría legal; un área de operaciones; una oficina de recursos humanos; una oficina de materiales y presupuesto; y una unidad de archivo. Para ser una dependencia de la presidencia, es una dependencia sorprendentemente independiente. La dirección la ocupa una persona de calificada experiencia en materia de seguridad, y el que valora la idoneidad de la persona para el puesto es el Presidente. Los funcionarios de la DIS son costarricenses, mayores de edad, con tercer ciclo aprobado. Y deben tener licencia si el puesto lo requiere. Deberán “mantener en el mayor anonimato posible su identidad e igualmente absoluta reserva sobre la naturaleza de sus funciones, identidad de otros miembros del grupo de trabajo, ubicación de sus instalaciones, tipos de equipo con que se cuente”. No hacerlo constituye una falta grave.

La recopilación de información, actividad principal de la DIS, se realiza con una partida de gastos confidenciales del Ministerio de la Presidencia. La comunicación con organismos judiciales se realizará mediante canales confidenciales. A la DIS le queda prohibida la “publicación de informes de investigaciones concluidas”.

Pondría con muchísimo gusto un enlace al reglamento, pero el Sistema Costarricense de Información Jurídica hace imposible hacer tal cosa. Vayan al sitio web y busquen el decreto ejecutivo 32522.

¿Cuál es el problema con la DIS? El mismo que el de todas las policías secretas del mundo: en ellas trabaja gente, y es gente, que como cualquier otra, comete errores. Sole tiene razón cuando cita la Vida de los otros, pues esa es una representación clara de qué sucede cuando la gente se encuentra con acceso a información privada de otras personas sin el conocimiento de ellas. No conocemos nada de los otros puestos, pero al menos los directores de la DIS son transitorios, así como llegan se van. Y cuando se van no se olvidan mágicamente de todo lo que supieron sentados en esa silla. Y precisamente porque son gente, es sumamente difícil que lo que saben, que deben negar que saben, no afecte sus decisiones futuras.

Está además el problema que es imposible saber qué hace realmente la DIS. En espionaje hay un problema ampliamente conocido: en la medida de lo posible no se debe actuar en función de la información recolectada. Caso contrario, se revela el hecho que se dispone de tal información. Sucedió en la segunda guerra mundial, cuando Inglaterra descifró comunicaciones secretas de Alemania, y le resultaba imposible evitar el hundimiento de sus barcos, puesto que evitar consistentemente ataques alemanes alertaría al enemigo del conocimiento de información que creían secreta. Por ello la DIS no puede salir a la calle diciendo “¡evitamos que pasara tal cosa!” pues eso revelaría información sobre sus métodos y sus capacidades.

En toda esta pequeña novela, algo que no se puede dejar pasar por alto es que Celso Gamboa, hoy ministro de Seguridad, se opuso al cierre de la DIS, cuando él todavía era parte de la administración Chinchilla, en la que era director del organismo. Atribuir malicia nunca es buena idea y las teorías de conspiración no llevan a ninguna parte, pero hay días en los que uno también tiene que admitir que las coincidencias son demasiadas.

Sensatez, honradez y coherencia

Hoy saqué el día para asistir al traspaso de poderes de la administración Chinchilla a la administración Solís. ¿Por qué? Porque creo que Luis Guillermo la va a tener cuesta arriba, y este gobierno va a necesitar todo el apoyo que pueda encontrar. Ese apoyo comienza con algo tan simple como ser testigo del inicio de su mandato.

¿Por qué creo que la va a tener cuesta arriba? Porque existen muchos intereses creados en torno a que el primer gobierno del PAC no tenga éxito, que dentro de cuatro años se pueda decir “¿ven? ¡fue fatal! ¡mejor vuelvan a lo seguro, a lo que sí funciona!”

Pero también la va a tener cuesta arriba porque cualquier error se lo van a cobrar al doble, y errores habrán muchos. En campaña Luis Guillermo dijo que apoyaría las uniones civiles de parejas del mismo sexo, y hace una semana el PAC parecía estar comprometiendo esa promesa a cambio de obtener la presidencia de la Asamblea. Tal cual él lo pide, se le reclamó este hecho a Luis Guillermo, y la respuesta fue menos que satisfactoria. No hace mucho dijo que Mariano Figueres no ocuparía un cargo en su administración, y hoy se desdijo nombrándolo en la DIS, organismo que el PAC ha identificado como innecesario y una cosa que no tiene razón de ser en Costa Rica. ¿Tres errores así sin que haya acabado el primer día de gobierno?

Hoy dijo:

Tampoco puede haber homenaje mejor a un pueblo tan devoto e ilusionado como el mío, que el servirle con tres virtudes supremas de la política: la sensatez, la honradez y la coherencia entre lo que se dice y lo que se hace.

No por querer apoyar el gobierno quiere decir que se deba uno hacer de la vista gorda ante los errores. Cuando las decisiones no sean sensatas, carezcan de honradez o revelen incoherencia entre lo dicho y lo hecho, todo eso será señalado. La duda enorme es qué hará con los señalamientos, porque hasta ahora las respuestas no abundan.

Dice Luis Guillermo que su gobierno será transparente, y que “se cuenta con recursos tecnológicos cuya aplicación generalizada será una prioridad de mi Administración.” Yo espero que esa anhelada transparencia no se quede en mensajitos (sin respuesta) en Twitter y Facebook, y que tampoco se vaya al extremo opuesto, construyendo catedrales complejísimas como MER-LINK, cuando las soluciones simples, apropiadas y que se pueden implementar progresivamente están al alcance de la mano. Espero que esas soluciones sean sensatas, honradas y coherentes.

Hubiese querido ver que el primer decreto presidencial fuese directamente a la raíz del problema y al centro de la propuesta del PAC: el combate de la corrupción. Luis Guillermo optó por un decreto de otro tipo, atendiendo emergencias cuya naturaleza no es completamente clara, y cuya motivación no está completamente explicada. No dudo que el decreto es importante, pero para el primer acto de gobierno, hubiese querido algo con un simbolismo más grande y un mensaje más claro.

Espero que esta administración sea exitosa. Espero que haga lo que dijo, y que diga lo que hace. Espero que abandonemos la política de “mejor pedir perdón que permiso.” Espero que las palabras sean más que palabras.

Cuando el historiador no sabe que edita la historia

Hace meses un compañero en la oficina se puso a analizar el flujo de tweets que ocurrió durante uno de los debates de las pasadas elecciones presidenciales como parte del trabajo final de un curso que estaba llevando en ese momento. Conversamos mucho respecto a qué se podía hacer con los datos y qué tipo de información se podía extraer de ellos. A partir de esas conversaciones me quedó la curiosidad del tema. Por ese motivo, desde hace unas semanas he estado recolectando información relacionada a la presencia en Twitter de Luis Guillermo Solís, la cuenta @luisguillermosr. Más específicamente, dentro de ciertos límites, guardo todos los tweets relacionados con esa cuenta: tweets, retweets y menciones.

A partir de ese ejercicio he aprendido un montón de cosas respecto a cómo funciona Twitter, desde lo más tonto (para Twitter los retweets cuentan como menciones), pasando por cosas inesperadas (para cada tweet, Twitter provee un posible lenguaje en el que está escrito el tweet en cuestión) hasta llegar a cosas realmente complicadas (cada vez que alguien hace un retweet, el retweet completo aparece en el “time line” del autor del tweet original, y esto incluye una copia del tweet original, pero con la información de retweets actualizada, y es el cliente el que decide cómo presentarle ese tweet al usuario).

Uno de los detalles más curiosos es qué sucede cuando alguien borra un tweet. Tal vez lo primero que hay que tener en mente es que en Internet nada se borra, pues es una red de redes, una colección de sistemas autónomos sobre los cuales no existe un único punto de control. Si yo “borro” un tweet, lo más probable es que no se borre nada en Twitter, o al menos no inmediatamente. Pero más allá de eso, yo no borro nada. Primero porque no tengo forma de saber que un tweet fue borrado (hasta donde puedo ver, la única forma de saber si un tweet fue borrado es preguntar si ese tweet todavía existe, y dada la cantidad de tweets que tengo, no puedo hacer eso). Y segundo, porque no quiero.

Acá yo estoy claro que mucha gente acaba de arrugar la cara, y alguna incluso está comenzando a escribir para decirme que soy un maldito que no sabe respetar el deseo de las demás personas de poder controlar su imagen en Internet. Si usted lo que desea es controlar su imagen en Internet, debería comenzar por no utilizar Twitter. En el momento que decide hacer lo contrario, acepta implícitamente verse expuesto a esta clase de situación. En Internet nada se borra, ni siquiera eso que usted cree que borró.

El ejercicio que estoy haciendo tiene una componente muy sencilla, estadística, que es la que produce cosas como por ejemplo esta:

que responde a una pregunta muy sencilla: ¿cuánto se menciona diariamente la cuenta @luisguillermosr?

Viendo precisamente esas estadísticas para ayer me encontré con que había exactamente un tweet de @luisguillermosr en todo el día, y ese único tweet, de acuerdo con los datos que tengo, recibió una enorme cantidad de retweets (varios miles). Me pareció raro, pues ayer en Costa Rica no pasó nada realmente digno de mencionar, e incluso los tweets más populares de @luisguillermosr difícilmente superan 500 retweets (la cuenta tiene 40 mil seguidores, en Internet es raro que más del 10% de los usuarios que reciben un dato hagan públicamente algo con el, y un retweet es un “algo” muy público y que demanda en general una alta identificación con el contenido al que se da retweet). Investigando me di cuenta que tenía un error en la forma en la que estaba contando retweets: cuando se observa un retweet de algo, Twitter no reporta la cantidad de retweets del retweet, sino que le adscribe al retweet los retweets del tweet original (mi confusión viene del hecho que Google+ hace algo más correcto desde el punto de vista de los datos, pero menos satisfactorio para el ego).

El caso es que este tweet extremadamente popular de @luisguillermosr no era de esa cuenta, sino que era un tweet de otra cuenta que había sido retwitteado por @luisguillermosr. Pero me di cuenta de algo más. El retweet de @luisguillermosr no existe. Debería estar aquí, pero no está. Yo sé que existió porque lo tengo en mi base de datos. Sé cuando fue retwitteado (17 de abril, 2:23 pm). Sé que el tweet original ya era popular cuando @luisguillermosr lo retwitteó (2126 retweets). Y también sé que era algo controversial (644 favoritos; he visto que la gente favorece un tweet que le gusta; favorece y retwittea uno con el que está de acuerdo; y a veces parece que retwittea sin favorecer uno con el que no necesariamente está de acuerdo, pero que quiere que otros vean). El tweet original dice esto:

Mil años de soledad y tristeza por la muerte del más grande colombiano de todos los tiempos! Solidaridad y condolencias a la Gaba y familia

Yo honestamente no le veo el problema al tweet, y menos para que causara la reacción que causó. Me da la impresión que una de las controversias parece ser el uso de “mil” y no “cien”. Uno puede imaginarse fácilmente que el autor está tratando de enfatizar la dimensión de la muerte diciendo precisamente que no son solo “cien años de soledad”, pero la reacción de los usuarios va más por el lado de “¡te equivocaste, estúpido!” (cosa que, debo decir, parece ser usual en Twitter). Otro de los temas conflictivos parece ser que la salud del difunto era un tema polémico en Colombia (la comunicación pública en torno al tema parece haber sido “papá, estamos todos bien”). También parece que la mención de “la Gaba” no cayó particularmente bien. Pero por encima de todo esto, el problema real con ese tweet no es el tweet en sí mismo, es quién lo escribió (que también es un tema recurrente en Twitter): Juan Manuel Santos. El caso es que el pequeño tweet fue un chispero.

Volviendo a Costa Rica, pasó algo así: @luisguillermosr retwittea este tweet; la computadora que hace el proceso del que hablaba antes lo ve y lo guarda; horas después, no sé cuándo realmente, @luisguillermosr, posiblemente viendo lo polémico del tweet, decide borrar el retweet; al día siguiente, yo mirando datos para ver que hay de nuevo me encuentro con el tweet popular, determino que hay un error en el proceso que uso, y me doy cuenta, por casualidad, que el retweet fue borrado.

Y acá a mi me entra la duda…

¿Sabe Luis Guillermo Solís que el grupo de personas que operan @luisguillermosr hace esto con su imagen? Porque ignorando todo lo demás, como historiador que es debería ser al menos incómoda la idea de decir algo en público y venir detrás a tratar de hacer como si nunca lo hubiese dicho. Un poco más problemático es el hecho que esta no es la primera vez que pasa algo así con esta cuenta, y han habido casos en los que Luis Guillermo Solís dice una cosa (en televisión en vivo, nada más y nada menos) y @luisguillermosr dice otra, al mismo tiempo.

Es aún más complicado el hecho que mucha gente (en la base de datos tengo más de 38 mil tweets) cree a todas luces que cuando @luisguillermosr escribe es Luis Guillermo Solís quien está escribiendo, y que cuando le escriben a @luisguillermosr es Luis Guillermo Solís quien está leyendo. Este tema es aún más problemático dado que parte su tema de campaña fue precisamente no quedarse encerrado en Casa Presidencial sino salir a la calle a hablar con la gente cara a cara, sin embargo la conducta de @luisguillermosr es hablar, hablar y hablar y rara vez responder. De hecho, hay tan pocas respuestas que se me ha hecho tremendamente difícil determinar (estadísticamente) a qué responde @luisguillermosr. Mi hipótesis hasta ahora es que la mejor forma de lograr una respuesta es usar la palabra “mejenga”.

También es cierto, dada la medible reducción de la participación de @luisguillermosr luego de la elección, que toda la evidencia apunta a que Twitter fue utilizado como una tribuna para emitir propaganda, y no como un espacio para establecer una discusión (cosa para la que Twitter es de por sí mala, si quiere un espacio sano para discutir vea Google+). Es justo señalar que acá las bases y el candidato son dos cosas diferentes: las bases sí usaron Twitter, aparentemente independientes de la campaña, como un espacio para debate.

Quienes me conocen saben que a mi me dicen “transparencia” y yo me la creo. Que no soy de los que hacen como que son transparentes para caer bien, sino que por el contrario, puedo llegar al punto que a costa de tanta transparencia puedo caer mal (y en esos casos usualmente a quienes caigo mal es a los defensores de la transparencia selectiva). Transparencia en este caso sería por ejemplo no haber borrado un retweet, sino dar explicaciones de por qué el cambio de opinión. O sería también decir transparentemente cuáles son todas las personas que escriben detrás de @luisguillermosr. No se trata de andar desnudo por la calle, pero tampoco se trata de convencer a la gente que hay ropa donde no la hay. Se trata de tener claro con cúal voz habla @luisguillermosr.

Los políticos y la gente con mucho dinero ven como algo normal que su firma aparezca en cosas que nunca pasaron ante sus ojos. Luis Guillermo Solís nos pidió un puesto para hacer un cambio y fuimos muchos los que aceptamos ese trato. El puesto ya se lo dimos. Ahora queremos ver el cambio.