Blog Archives

Basta de matrices

11/22/2016

Levanten la mano los que están a favor del uso de matrices en un curso básico. Ahora levanten la mano los que están a favor del uso de matrices en un curso avanzado. Ahora levantenlá los que están a favor de que las matrices desaparezcan por completo. Y ahí parece que me quedo solo como un idiota con mi mano alzada.

La pregunta que nos convoca se refiere a cuánta álgebra matricial usar en un curso básico de econometría. Antes de argumentar, vayamos a las pruebas por autoridad o enumeración, que son las que menos me satisfacen. En los libros muy básicos (Gujarati, Ashenfelter, etc.) no hay matrices, o están relegadas a un capitulo o un apéndice. En el reciente texto de Angrist y Pischke, que parece querer revolucionar el tratamiento de la econometria básica, no hay ninguna matriz. En los libros más avanzados (Johnston, por ejemplo) hay matrices a troche y moche. Tambien las hay en Greene, y en Davidson y MacKinnon, si vamos al caso. Ahora, en el libro de posgrado de Wooldridge casi no hay matrices (en todo caso, si aparecen, es como productos externos de vectores) y en el capitulo de Newey y McFadden (del Handbook of Economerics IV, un excelente tratamiento de la teoría asintotica estándar, de nivel matemático muy por arriba de todos los textos antes mencionadas) no hay casi ningúna matriz. Estas aprecieciones sugieren que parece haber una suerte de “curva de Kuznets” del uso de las matrices: cuando uno empieza no hay matrices, después aparecen por todos lados, y luego desaparecen paulatinamente, como Simon Kuznets decía que ocurria con la desigualdad a medida que una economía se desarrollaba.

Ahora si en vez de movernos en el “grado de desarrollo” de la econometría (Gujarati, Johnston, Newey y McFadden) nos movemos en el tiempo, las matrices desaparecen aun más rápido: restringiendonos a textos intermedios (para alumnos de licenciatura avanzados, o de posgrado), hay muchas menos matrices en el nuevo texto de Hansen o en las notas de Joris Pinkse que en Johnston y Di Nardo. Ni hablar del revolucionario libro del texto Angrist y Pischke (Mostly Harmless Econometrics) que creo que no tiene ninguna matriz (nuevamente, ¡los productos externos no cuentan!)

Mi primer encuentro con la econometría fue allá lejos en los ochenta, en épocas sin computadoras personales. Más allá de los esfuerzos de mis profesores (a quienes evoco con mucho respeto), el recuerdo que tengo de la econometría de otrora es el de una maraña infame de algebra matricial.

La impresión que le queda a varios es que el derrotero de la madurez econométrica pasa por las matrices, es lo que separa a las niñas de las damas; los machos sabemos matrices, los niñitos no. De hecho cuando esta visión fue compartida en el grupo Econometria Avanzada, recibí durísimas críticas de parte de los foristas, la mayoría en la dirección de la frase “si te gusta el durazno, aguantate la pelusa”, o que “es imposible nadar sin mojares”, sugieriendo que las matrices son una suerte de requisito inciatico ineludible para acceder a las ligas superiores de la econometría.

El punto que intento hacer es preguntar si realmente se justifica el apabullante uso de matrices en un curso básico. Existe un resultado viejo, pero revitalizado por Davidson y MacKinnon, rebautizado como Teorema de Frisch-Waugh-Lovell (TFWL), que casi, casi, tira a las matrices por la borda.

ste teorema dice dos cosas. Supongamos que la variable explicada es Y y que las explicativas son X y Z. Supongamos que nos interesa el coeficiente de regresar Y en X y Z, y consideremos dos métodos alternativos. El primero consiste en el que todos conocemos: regresar Y en X y Z, y retener el coeficiente correspondiente a X. El segundo es en dos etapas. Primero regresamos X en Z. Luego regresamos Y en los residuos de la regresion anterior como única variable explicativa. Claramente, el metodo funciona si Z en vez de ser una variable explicativa es cualquier vector de variables explicativa. Para lo que viene, es fundamental observar que la segunda regresion del metodo solo involucra a una sola variable explicativa (es una simple regresion bivariada). El TFWL pregona dos cosas. Primero que los resultados obtenidos por ambos métodos son exactamente iguales. No es un resultado asintótico ni una aproximacion, es posible mostrar que ambas estrategias dan idénticos resultados. El segundo resultado es que los residuos del metodo tradicional y los de la segunda étapa del método nuevo son idénticos.

Una de las muchas consecuencias de este teorema es que casi cualquier resultado del modelo lineal con K variables estimado por el método de minimos cuadrados (o cualquier otro que proyecte, como minimos cuadrados generalizados o variables instrumentales) es reducible al caso de dos variables, ya que a la larga, y como les anticipe, la segunda étapa del método alternativo es siempre una regresion bivariada. O sea que, y por sorprendente que les parezca, ¡el modelo con K variables es un caso particular del modelo con dos variables!. Si. Los reyes magos son tus padres, la lucha profesional es falsa y el “reduce fat fast” (ese que publicita Erik Estrada para bajar de peso, y que uno se pregunta por qué justamente a él no le funciona) no sirve para nada. El dÍa que me enteré de esto (hace unos 20 años) casi me largo a llorar. ¡Tanto tiempo invertido en esas malditas matrices para que un teoremita me diga que en realidad casi todo puede escribirse sin ellas! Bueno, bueno, uno podría argumentar que para probar este teorema es necesario meter matrices, pero tampoco es estrictamente cierto (y si no me creen, vean el libro de Angrist y Pischke).

Y aquí juego dos cartas fuertes. En primer lugar, estoy casi convencido de que es posible dictar perfectamente un curso básico sin matrices y sin perder rigor. Por el contrario, liberados los alumnos del oprobio del algebra matricial sin sentido, podrían focalizar en interpretar los métodos y resultados o concentrarse en la formalidad correcta. Segundo, y contra lo que muchísima gente cree, uno debería pasar mucho más tiempo con el modelo simple con dos variables, que, teorema de Frisch-Waugh-Lovell mediante, contiene en sus fauces al modelo con K variables.

No es este un argumento en contra de las formalizaciones, sino todo lo contrario. Quizas en un curso más avanzado convenga invertir en demostrar el teorema de Frisch-Waugh-Lovell para muestras finitas, y hasta para la población, lo que justifica una sana inversión en espacios de Hilbert.

Mi invitación honesta es a no formalizar al divino botón. Las cosas relevantes tienden a ser complejas, pero no necesariamente al reves. Y a veces pienso que los docentes complicamos las cosas para hacerles creer a los alumnos que son relevantes. Y en esta espuria reversión de la causalidad perdimos todos.

PD: por contadictorio que parezca, opino que el economista medio sabe poco y mal álgebra. Un libro que me cambio mi visión de estas cuestiones es el de Axler (Linear Algebra Done Right), cuyo titulo patotero sugiere que va a hacer las cosas “de otra manera” (sin determinantes, con autovalores). No es lectura fácil, pero es realmente distinto al resto.

1 Comment

El Perro de Raul Portal (sobre predicciones y predictores)

11/10/2016

Extracto de Que es (y que no es) la Estadistica

El conductor televisivo Raúl Portal decía que tenía un perro muy obediente (Bobby), al punto tal que le decía “Bobby, ¿venís o no venís?”, tras lo cual Bobby venía o no venía. Este ejemplo, simple como la mayoría de los de este libro, muestra que una forma bastante trivial de acertarle al futuro es ser ampliamente general (el dólar sube, baja o se queda quieto, algún número entre el cero o el 36 sale en la ruleta, etc., etc.). Naturalmente, cualquier predicción relevante hace referencia a un evento mucho más específico, de compleja deducción en base al conocimiento disponible en el presente. Desde un punto de vista lógico, predecir no es un ejercicio muy diferente a estimar, y consecuentemente, en varias ocasiones amerita un análisis similar.

A fines de desentrañar esta cuestión de qué es una buena predicción y de quién es un buen predictor, comencemos con un ejemplo. Supongamos que una persona está interesada en jugar una sola ficha a un solo número en una ruleta estándar (la que tiene números de 0 a 36, no esas raras con doble cero como en Las Vegas). A tal efecto, consulta a dos analistas/predictores. El primero, de sólida formación matemática e ingenieril, luego de observar con detalle el funcionamiento de la ruleta dice:

- Jugále a cualquier número, no veo ninguna razón por la que favorecer a un número por sobre otro. La suerte es loca.

Tras lo cual proporciona una larga descripción del movimiento de la ruleta, de la forma en la que el croupier lanza la bolita y sobre la imposibilidad de predecir el número que va a salir.

El segundo predictor, sin decir agua va, suelta:

- Colorado el 32.

Lo interesante del evento predictivo es que la evaluación de “quién es el mejor predictor” hay que hacerla ahora, antes de poner la ficha. Luego de que cantaron el número, ya es pescado viejo, no sirve. ¿Y entonces? ¿Qué hacemos?

Podríamos buscar el currículum de ambos. El primero podría ser un experimentado ingeniero, con amplios conocimientos de mecánica, una persona honesta y honrada, de dilatada trayectoria. También podría ser un embustero, amigo de los tecnicismos y las palabras ampulosas. El segundo podría ser un viejo tahúr, de años de paño y whisky, el mago que no revela los trucos. También podría ser un fullero, que disfraza su viveza de mística y solo está detrás de la presa fácil. Podríamos consultar a amigos que hayan usado el servicio de estos analistas. Podríamos consultar sus historias predictivas, y ver cuánto erraron y acertaron en el pasado. Podríamos pedirles a estos predictores que nos aclaren de dónde sale la predicción, y el ingeniero podría explayarse sobre mecánica clásica y sobre la fisiología de los dedos y la estructura de las bolitas. Lo hará en forma clara, y tendremos que confiar en su habilidad explicativa, o quizás seamos víctimas de su facilidad de palabra. Quizás entendamos una parte de su explicación. El segundo predictor posiblemente juegue la carta de la oscuridad, y ponga cara de “si yo digo carnaval, vos ponete la careta y apretá el pomo”.

Entre medio de tanto dilema, el croupier, ajeno a estas disquisiciones, ya dijo “no va másssss” y luego grita “¡Colorado el 32!”.

¿Quién es el mejor predictor?

El grueso de mis alumnos pisa el palito y dice “el segundo, el que le pegó”. Y he aquí la trampa. No lo sabíamos antes de que salga el número, y tampoco lo sabemos ahora. Más que nada porque ninguno se ha equivocado.

¿Cómo? Aun cuando no se note, el ingeniero fue bastante más allá de la predicción del perro Bobby de Raúl Portal. No dijo “sale cualquier número” sino “cualquier número sale con la misma chance”, es decir, agregó muchísima más información que una mera descripción de los resultados posibles. En base a su conocimiento de cómo funcionan las ruletas, las bolitas y los dedos, dice, en forma honesta, que no tiene más chance de salir un número que otro. Que haya salido el 32 de ninguna manera refuta su predicción. Es más si lo patoteásemos diciéndole:

- Oiga, ¿cómo era esto de que no era más factible que salga ningún número que otro? Entonces, ¿por qué aparece el 32?

Diría:

- Quedáte cerca de la ruleta, registra mentalmente todos los números que salen (y hacélo hoy, mañana y cuando quieras, pero no saques un papel que vas preso porque está prohibido) y vas a ver que tengo razón.

Lo que el ingeniero dice es que si viésemos las historias de números que salen en la ruleta, efectivamente, la proporción de veces que sale cada uno de los números, del 0 al 36, es más o menos la misma para todos. El lector incrédulo debería realizar el experimento por sí mismo. He aquí este libro proporcionando una excusa científica para que a uno lo dejen ir al casino sin culpa.

Estudiemos ahora al segundo predictor. Pueden haber pasado varias cosas. La primera es que este tipo tuvo muchísima suerte. Soltó un número y de chiripa salió. ¿Por qué soltó el 32? ¡Vaya uno a saber! Eligió un número cualquiera y lo dijo. Pruebe uno soltar números al voleo, del 1 al 6, y luego tirar un dado, y verá que cada tanto le pega Es más, quizás ese sea su truco: el tipo se para al lado de un desprevenido, dice un número cualquiera, y de tanto hacerlo alguna vez le va a pegar, y a algún otario le hará creer que es un adivino. Más adelante contaremos una estrategia engañosa en las finanzas, aparentemente más elegante, pero igual de fraudulenta.

También hay otra historia posible. Nuestro oscuro personaje quizás sea un experto jugador, conocedor de los detalles del paño, de los mínimos movimientos del croupier. Si este extraño personaje no suelta información antes de que salga el número, es imposible discernir si se trata de chapucero o de un experto. El farsante se revela si en sucesivos tiros sale cualquier cosa, sin relación a lo que predice. Y el experto emerge si, por el contrario, sus predicciones tienden a coincidir con los resultados.

En síntesis, los eventos dignos de ser predichos son los eventos complejos, que admiten varios resultados. La disquisición anterior sugiere que es crucial distinguir entre predictores y predicciones, y que hay dos caminos para chequear la confiabilidad de un predictor y, consecuentemente, de sus predicciones. Una consiste en revisar su historia predictiva, su historial de éxitos y fracasos. La otra consiste en explorar su autoridad predictiva, es decir, su capacidad para dar sustento a sus predicciones o cualquier tipo de información que nos permita confiar en él o ella.

crisol de gatos

Click here to edit.

Escritos sueltos sobre temas variados. Musica, econometria, estadistica, educacion, fotografia y la vida misma.

Random writing on several topics, mostly in Spanish. Music, econometrics, statistics, education, photography and life.

Basta de matrices

El Perro de Raul Portal (sobre predicciones y predictores)

crisol de gatos

Click here to edit.

Archives

Categories