Levanten la mano los que están a favor del uso de matrices en un curso básico. Ahora levanten la mano los que están a favor del uso de matrices en un curso avanzado. Ahora levantenlá los que están a favor de que las matrices desaparezcan por completo. Y ahí parece que me quedo solo como un idiota con mi mano alzada.
La pregunta que nos convoca se refiere a cuánta álgebra matricial usar en un curso básico de econometría. Antes de argumentar, vayamos a las pruebas por autoridad o enumeración, que son las que menos me satisfacen. En los libros muy básicos (Gujarati, Ashenfelter, etc.) no hay matrices, o están relegadas a un capitulo o un apéndice. En el reciente texto de Angrist y Pischke, que parece querer revolucionar el tratamiento de la econometria básica, no hay ninguna matriz. En los libros más avanzados (Johnston, por ejemplo) hay matrices a troche y moche. Tambien las hay en Greene, y en Davidson y MacKinnon, si vamos al caso. Ahora, en el libro de posgrado de Wooldridge casi no hay matrices (en todo caso, si aparecen, es como productos externos de vectores) y en el capitulo de Newey y McFadden (del Handbook of Economerics IV, un excelente tratamiento de la teoría asintotica estándar, de nivel matemático muy por arriba de todos los textos antes mencionadas) no hay casi ningúna matriz. Estas aprecieciones sugieren que parece haber una suerte de “curva de Kuznets” del uso de las matrices: cuando uno empieza no hay matrices, después aparecen por todos lados, y luego desaparecen paulatinamente, como Simon Kuznets decía que ocurria con la desigualdad a medida que una economía se desarrollaba.
Ahora si en vez de movernos en el “grado de desarrollo” de la econometría (Gujarati, Johnston, Newey y McFadden) nos movemos en el tiempo, las matrices desaparecen aun más rápido: restringiendonos a textos intermedios (para alumnos de licenciatura avanzados, o de posgrado), hay muchas menos matrices en el nuevo texto de Hansen o en las notas de Joris Pinkse que en Johnston y Di Nardo. Ni hablar del revolucionario libro del texto Angrist y Pischke (Mostly Harmless Econometrics) que creo que no tiene ninguna matriz (nuevamente, ¡los productos externos no cuentan!)
Mi primer encuentro con la econometría fue allá lejos en los ochenta, en épocas sin computadoras personales. Más allá de los esfuerzos de mis profesores (a quienes evoco con mucho respeto), el recuerdo que tengo de la econometría de otrora es el de una maraña infame de algebra matricial.
La impresión que le queda a varios es que el derrotero de la madurez econométrica pasa por las matrices, es lo que separa a las niñas de las damas; los machos sabemos matrices, los niñitos no. De hecho cuando esta visión fue compartida en el grupo Econometria Avanzada, recibí durísimas críticas de parte de los foristas, la mayoría en la dirección de la frase “si te gusta el durazno, aguantate la pelusa”, o que “es imposible nadar sin mojares”, sugieriendo que las matrices son una suerte de requisito inciatico ineludible para acceder a las ligas superiores de la econometría.
El punto que intento hacer es preguntar si realmente se justifica el apabullante uso de matrices en un curso básico. Existe un resultado viejo, pero revitalizado por Davidson y MacKinnon, rebautizado como Teorema de Frisch-Waugh-Lovell (TFWL), que casi, casi, tira a las matrices por la borda.
ste teorema dice dos cosas. Supongamos que la variable explicada es Y y que las explicativas son X y Z. Supongamos que nos interesa el coeficiente de regresar Y en X y Z, y consideremos dos métodos alternativos. El primero consiste en el que todos conocemos: regresar Y en X y Z, y retener el coeficiente correspondiente a X. El segundo es en dos etapas. Primero regresamos X en Z. Luego regresamos Y en los residuos de la regresion anterior como única variable explicativa. Claramente, el metodo funciona si Z en vez de ser una variable explicativa es cualquier vector de variables explicativa. Para lo que viene, es fundamental observar que la segunda regresion del metodo solo involucra a una sola variable explicativa (es una simple regresion bivariada). El TFWL pregona dos cosas. Primero que los resultados obtenidos por ambos métodos son exactamente iguales. No es un resultado asintótico ni una aproximacion, es posible mostrar que ambas estrategias dan idénticos resultados. El segundo resultado es que los residuos del metodo tradicional y los de la segunda étapa del método nuevo son idénticos.
Una de las muchas consecuencias de este teorema es que casi cualquier resultado del modelo lineal con K variables estimado por el método de minimos cuadrados (o cualquier otro que proyecte, como minimos cuadrados generalizados o variables instrumentales) es reducible al caso de dos variables, ya que a la larga, y como les anticipe, la segunda étapa del método alternativo es siempre una regresion bivariada. O sea que, y por sorprendente que les parezca, ¡el modelo con K variables es un caso particular del modelo con dos variables!. Si. Los reyes magos son tus padres, la lucha profesional es falsa y el “reduce fat fast” (ese que publicita Erik Estrada para bajar de peso, y que uno se pregunta por qué justamente a él no le funciona) no sirve para nada. El dÍa que me enteré de esto (hace unos 20 años) casi me largo a llorar. ¡Tanto tiempo invertido en esas malditas matrices para que un teoremita me diga que en realidad casi todo puede escribirse sin ellas! Bueno, bueno, uno podría argumentar que para probar este teorema es necesario meter matrices, pero tampoco es estrictamente cierto (y si no me creen, vean el libro de Angrist y Pischke).
Y aquí juego dos cartas fuertes. En primer lugar, estoy casi convencido de que es posible dictar perfectamente un curso básico sin matrices y sin perder rigor. Por el contrario, liberados los alumnos del oprobio del algebra matricial sin sentido, podrían focalizar en interpretar los métodos y resultados o concentrarse en la formalidad correcta. Segundo, y contra lo que muchísima gente cree, uno debería pasar mucho más tiempo con el modelo simple con dos variables, que, teorema de Frisch-Waugh-Lovell mediante, contiene en sus fauces al modelo con K variables.
No es este un argumento en contra de las formalizaciones, sino todo lo contrario. Quizas en un curso más avanzado convenga invertir en demostrar el teorema de Frisch-Waugh-Lovell para muestras finitas, y hasta para la población, lo que justifica una sana inversión en espacios de Hilbert.
Mi invitación honesta es a no formalizar al divino botón. Las cosas relevantes tienden a ser complejas, pero no necesariamente al reves. Y a veces pienso que los docentes complicamos las cosas para hacerles creer a los alumnos que son relevantes. Y en esta espuria reversión de la causalidad perdimos todos.
PD: por contadictorio que parezca, opino que el economista medio sabe poco y mal álgebra. Un libro que me cambio mi visión de estas cuestiones es el de Axler (Linear Algebra Done Right), cuyo titulo patotero sugiere que va a hacer las cosas “de otra manera” (sin determinantes, con autovalores). No es lectura fácil, pero es realmente distinto al resto.