Marta está confundida. No le hizo ninguna gracia el telegrama de despido que inesperadamente recibió el mes pasado; tantos años, tantas ilusiones. Que el ajuste, que la macroeconomía, que el contexto político (la versión “no sos vos, soy yo” de las relaciones laborales), pero que algún dejo de culpa le ha instalado. Pero por otro lado la puso muy contenta que muy rápidamente varias empresas de la industria la contactasen con varias alternativas laborales. Así que al sin sabor inicial le siguió un aire de entusiasmo, aun cuando todavía le queda alguna duda de cuánto del despido fué culpa de ella y cuanto no.
A fines de reflexionar sobre estas cuestiones, Marta decide tomarse un mes libre antes de comenzar con su nuevo trabajo. Y justo un miércoles de esas autoimpuestas vacaciones suena el timbre a las 9 de la mañana: había olvidado por completo que ese día había censo nacional.
Raúl, el encuestador, da comienzo a las preguntas de rigor a fines de acelerar el trámite con el extenso formulario. ¿Edad? ¿Género? ¿Máximo nivel educativo alcanzado?, inquiere, en un acelerado ping-pong de preguntas y respuestas. Y en algún momento Raúl dice ¿Situación ocupacional?, usando una jerga burocrática mucho más precisa, que ella solo pudo interpretar como “¿Está desempleada?”.
Marta intentó una larga explicación. Que si bien ese miércoles estaba efectivamente desempleada, no lo había estado durante 12 años, y que había sido despedida por cuestiones ajenas a su excelente desempeño, que la situación económica, que el contexto político, que no fue ella, que fue la empresa. Y que muy rápidamente había vuelto a conseguir trabajo y que se había tomado un tiempo para pensar y que la semana que viene ya estaría de vuelta empleada.
Y con una mezcla de desilusión y bronca vio como Raúl, apurado por el larguísimo día de trabajo que le esperaba, tildo cruelmente la casilla de “desocupado/a”. Los intentos de explicación de Marta (que de haber venido la semana que viene, o hace un mes la cosa seria distinta, que es solo una circunstancia) recibieron un lacónico “Señorita, estoy relevando datos, no explicaciones” por parte de Raúl, que solo atinó a proseguir con la catarata de preguntas propias de un censo nacional.
Y así es como Marta opina que el censo esta mal, porque la respuesta que Raúl registró no refleja su verdadero status laboral. Y Raúl, que está bien, contento con haber cumplido con las pautas que le dieron en el entrenamiento para ser censista.
Todo dato es una herramienta de algo. Las preguntas y sus respuestas son una circunstancia atravesada por un lenguaje y un contexto, y como tal admiten varios usos y significados. La llave de salida de este dilema (el censo está bien o mal) está donde la dejamos al comienzo de este libro: pensar en el verdadero objetivo de la herramienta.
Supongamos que el objetivo del censo es medir el bienestar de la población (que no es tan así). Entonces, la pregunta sobre el desempleo lleva implícita la idea de que estar desempleado es malo y no estarlo es bueno. Desde este punto de vista, Marta está desempleada pero se siente bien. De modo que si el verdadero objetivo del censo es relevar el bienestar de la población, la respuesta “empleada” refleja mejor el status de Marta (y de la nación) que la que Raúl anotó. Ahora, si el objetivo del censo es cuantificar detalles del funcionamiento del mercado laboral, la respuesta “desempleada” es útil, lo que quizás le permita a los analistas explorar discernir la naturaleza permanente de la temporaria del desempleo.
En definitiva, la relevancia de los datos depende del propósito. Por ejemplo, tal vez lo que resulta de interés es medir la tasa (y no el volumen) de desempleo, es decir, la proporción de personas desempleadas en relación al total. Y quizás bajo este objetivo la circunstancia negativa que hace que Marta este desempleada justo cuando vino el censista se compense en la agregación con la de Analía que está empleada ese día pero sabe que a fin de mes tendrá que salir a buscar trabajo por el ya anunciado cierre de la panadería en la que trabaja.
A esta altura ya podemos adivinar la postura de nuestro viejo conocido Ireneo Funes: estaría de acuerdo con la postura de Raúl, porque los datos son los datos. Pero también un disconforme porque el censo usa “desempleo” para aglutinar cosas que él habría separado más finamente. En relación a esta cuestión, dice Borges que a Funes “no sólo le costaba comprender que el símbolo genérico perro abarcara tantos individuos dispares de diversos tamaños y diversa forma; le molestaba que el perro de las tres y catorce (visto de perfil) tuviera el mismo nombre que el perro de las tres y cuarto (visto de frente)”. Conjeturamos que el formulario censal que habría satisfecho a Funes seria extenso como la Biblioteca de Babel.
Muy interesantemente, la apreciación extrema de Funes sobre el censo es la que la mayoría de la gente tiene: de completitud, de agotar todas las instancias, de abarcarlo todo y no dejar dudas. El censo, desde esta perspectiva, es todo, es “la población”, como se dice en la jerga. En particular en relación a una muestra. A modo de ejemplo, el censo abarca a los mas o menos 3 millones de familias del Gran Buenos Aires, mientras que la Encuesta Permanente de Hogares (EPH) solo encuesta a 3.000.
Una encuesta como la EPH esta atravesada por una esencial aleatoriedad: hay un sorteo (sistemático y complejo, pero sorteo al fin) que decide qué familias son encuestadas y cuales no. Por el contrario, el censo esta ajeno a este lanzamiento de dados estadístico: todos los hogares son encuestados.
Ahora ¿verdaderamente el censo esta exento de aleatoriedades? Marta opinaría enfáticamente que no. Y Borges también.
En búsqueda de una respuesta a esta cuestión, volvamos por un instante al Jardín de Senderos que se Bifurcan. Según Borges, su creador Ts’ui Pen “creía en infinitas series de tiempos, en una red creciente y vertiginosa de tiempos divergentes, convergentes y paralelos. Esa trama de tiempos que se aproximan, se bifurcan, se cortan o que secularmente se ignoran, abarca todas la posibilidades.”.
Entonces, desde la perspectiva del mundo que plantea el Jardín, un censo es un reflejo (fiel) de las circunstancias exactas que enfrentaron al censista con el censado, y nada mas (y nada menos) que eso. Circunstancias que hicieron que Marta justo ese día esté desempleada y que Analía no, independientemente del resto de las circunstancias que quizás reflejen mejor sus derroteros. Entonces, visto desde El Jardín de Senderos que se Bifurcan, el censo es otra mera muestra, de la población de circunstancias infinitas, pero muestra al fin.
Intentemos aclarar una cosa, y como siempre a esta altura, usando la llave maestra de las discusiones de datos y estadísticas, que son discusiones sobre sus objetivos. Un censo es una herramienta crucial para proporcionar una fotografía precisa del status social, demográfico, económico y cultural de una nación en un momento en particular. Desde esta perspectiva, el conjunto de datos proporcionados por el censo son “la población”, finita por naturaleza, tanto como la cantidad de habitantes.
Pero desde muchas perspectivas un censo brinda necesariamente información incompleta, en mas precisa que la de cualquiera de sus su muestras (como la EPH) pero incompleta si lo que interesa es la población infinita de circunstancias.
Es importantísimo aclarar que esta cuestión no es un mero juguete intelectual sobre el infinito y a literatura (lo cual, en sí mismo, no seria nada malo), ya que, contra lo que instintivamente uno creería, el grueso de la actividad estadística percibe a los censos como meras muestras y no como poblaciones.
Lo que se espera del análisis estadísticos moderno va mucho más allá de una simple descripción burocrática de los datos (el promedio, el máximo, el mínimo y todo lo que las maestras le enseñan a los niños de la primaria), sino que los datos digan algo del proceso que los genera. Esta actividad inferencial es el auténtico motor de la estadística y la ciencia.
A modo de ejemplo de este uso inferencial, inteligente y no meramente administrativo del análisis de datos, pensemos un ejemplo simple. Supongamos que el director de un programa de maestría le reclama a un empleado que cuente la cantidad de alumnos del programa. Sin disponer de un registro, este empleado entra en el salón de clase y pregunta a los alumnos si saben si faltó alguien, le dicen que 2 personas. Así es que procede a contar, y agregando a los 2 que faltaron, la cuenta da 30. Misión cumplida.
¿Cuál es “la población”? Depende de la pregunta de interés. Si el objetivo del director es tener un reflejo exacto de las personas que al momento de la pregunta están en la maestría, la población son los 30 alumnos, claramente. Ahora, posiblemente el interés del director sea mas genérico, y lo que tenga en mente es ir con ese número a negociar con el decano para que le asigne un aula adecuada en el nuevo edificio de la facultad. Desde esta perspectiva lo que el director tiene en mente es una idea mucho mas compleja que “los 30 que están”, si no que abarca a los que podrían haber estado o no, a los que vendrían o no, etc.
En el marco de esta negociación, el decano preguntaría “¿Cuántos alumnos hay en la maestría?” y el director respondería “Y, este año hay 30”. A lo que el decano repreguntaría “No, digo “en general”. En este contexto, 30 es una mera estimación del número de asistentes a la maestría. Quizás el año que viene haya 28 o 32 o alguna cifra similar. Lo que el director esta haciendo con los datos es usar la estimación (30) para inferir un genérico como “el numero de gente que esperamos que venga a la maestría”. Desde esta perspectiva, los 30 alumnos son una mera muestra de todas las circunstancias que hicieron que ellos hagan la maestría y que otros no.
Borgeanamente, a estos 30 alumnos los observamos en las ramas del Jardín de Senderos que se Bifurcan en las cuales hicieron la maestría, y consecuentemente no vemos a aquellos cuyas circunstancias los pusieron en las ramas en las que no, porque fueron padres y prefirieron postergar la cursada un año, porque no estaban seguros, porque están ahorrando, etc. etc..
Usando un lenguaje más preciso, cuando el objetivo del censo son los datos que contiene, los datos constituyen la población. Pero cuando lo que interesa es aquello que está detrás de los datos, el censo es nada mas que una “megamuestra” del sinfín de posibilidades que generan los datos.
En una de las frases mas dramáticas de El Jardín de Senderos que se Bifurcan (y que no deja de estremecerme cada vez que la leo), Borges dice “el tiempo se bifurca perpetuamente hacia innumerables futuros. En uno de ellos soy su enemigo”. Marta está contenta porque sabe que para ella el tiempo ya se ha bifurcado en un futuro en el cual tiene trabajo. A Raúl no parece importarle.