Entendiendo la pandemia

Escala lineal vs. escala logarítmica

La escala lineal, esa manera de colocar los números de la recta numérica tal que queden equiespaciados de acuerdo a su valor, puede ser la más intuitiva pero no es la única. La gran estrella en los tiempos de pandemia de COVID-19 es la llamada escala logarítmica. ¿De qué se trata?

Escala lineal: le ponemos nombre a lo intuitivo

Tomemos la famosa y querida recta numérica. La manera más intuitiva que tenemos de ubicar datos en la recta (o quizás la manera a la cual estamos más acostumbrados…) es colocarlos de manera proporcional a su valor, como sigue:

escala_lineal\

A esta manera de colocar los datos en la recta numérica la llamamos “escala lineal”: números que difieren en la misma cantidad y que estarán separados por la misma distancia. Por ejemplo, los valores 10 y 20 están separados por la misma distancia que los valores 110 y 120, o que los valores 1.010 y 1.020 (sus diferencias son siempre 10).

Como veremos a continuación, esta no es la única manera de ubicar datos en una recta numérica. Y sí, podemos acomodar los datos del modo que deseemos dependiendo de la utilidad que queramos darle.

¿Cuándo la escala lineal NO es útil?

Veamos un ejemplo diferente. ¿Cómo quedan los siguientes datos en la recta numérica en la versión lineal que conocemos?

escala_logarítmica\

Algunos valores quedan demasiado pegados entre sí y casi no podemos distinguirlos (los valores chicos), mientras que otros quedan demasiado separados y ocupan casi toda la recta (los grandes). Parece bastante obvio que ocurra esto, dados los números que estamos considerando. Se debe a que los números que queremos colocar en la recta tienen tamaños muy, muy diferentes entre sí. Y no creas que es una situación tan rara, esto ocurre por ejemplo cuando estamos analizando datos de una cantidad que crece no solamente muy rápido sino que crece cada vez más rápido. Un ejemplo es el crecimiento exponencial de la cantidad de bacterias en un cultivo o del número de casos de una enfermedad como COVID-19.

Aunque podría ser obvio que en la recta numérica lineal los números muy grandes siempre van a tapar a los más chicos, no estamos obligados a acomodar los números de manera proporcional a su valor. ¡Podemos repartir los valores en la recta numérica del modo que queramos! ¿Cómo sería eso? Antes conviene hablar sobre tamaños.

El tamaño de un número

Un concepto que nos va a ayudar mucho es el de “tamaño de un número”. Aclaremos: para empezar, el propio valor de un número ya nos habla de su tamaño (1.000 es mucho más grande que 1, obviamente). Aquí nos referimos en realidad a una forma compacta de medir su tamaño, sin usar el número en sí mismo. Por ejemplo, quiero saber si un número está en las decenas, o en las centenas, o en los miles, etc. Y eso es justamente lo que nos dice el famoso logaritmo.

El logaritmo de un número es una operación matemática que dice, aproximadamente, si dicho número pertenece a las unidades o a las decenas o a las centenas, etc. (es decir, cuántos “ceros” tiene). Por ejemplo:

logaritmo\

Dijimos “aproximadamente” porque, por ejemplo, el número 20 tiene un solo cero estrictamente hablando pero su logaritmo vale 1,30. ¿Cómo se ve entonces si miramos los números intermedios? Fijate que el logaritmo de todas las decenas es siempre “uno coma…”:

logaritmo_1\

Y el logaritmo de las centenas es siempre “dos coma…”:

logaritmo_2\

Así, si el logaritmo de un número es por ejemplo “seis coma…” (6,…) ya sé que se trata de un número en los millones (pero no en las decenas de millones, porque tendría un logaritmo de “siete coma…”). El tamaño de un número tal como lo definimos recién es conocido también como el “orden de magnitud” de dicho número.

Y a continuación… la escala logarítmica

¿Notaste en la primera tabla que, mientras los números crecen multiplicándose por 10, el valor de su logaritmo crece aumentando de a uno? Repetimos la tabla acá:

escala_logarítmica\

Esta observación es crucial para lo siguiente. ¿Qué pasaría si en la recta numérica ubicamos los números tal que sus logaritmos queden equiespaciados, es decir separados por la misma distancia? Quedaría lo siguiente:

texto alternativo\

Notá que la distancia gráfica entre 1 y 10 es la misma que la distancia entre 10 y 100, o que entre 100.000 y 1.000.000. En todos los casos, el salto entre consecutivos significa que el número crece por un factor 10.

Un zoom apropiado para cada tamaño

Es importante notar que no estamos modificando los números, simplemente estamos ubicándolos de otra manera en la recta numérica. En cierto sentido sería como apretar los números grandes para que los números chicos tengan más espacio, pero haciéndolo de manera prolija y uniforme a lo largo de toda la recta. Mirá la relación entre ambas escalas:

texto alternativo\

Se ve que el rango de los números chicos está expandido en la escala logarítmica, mientras que el de los números grandes está comprimido, y todo ocurre “suavemente” sin saltos. La transformación entre la escala de la izquierda (lineal) y la escala de la derecha (logarítmica) es lo que muestra la visualización animada en la historia “¿Cuál es el ritmo de la pandemia?”.

Una escala apropiada para cada tipo de dato

Analizar datos de manera visual es apasionante. Un gráfico bien pensado y construido tiene una increíble capacidad para transmitir mucha información de manera extremadamente eficiente. Y no necesariamente esto implica que el gráfico será difícil de leer, más bien todo lo contrario. Esta área del conocimiento en particular, llamada visualización de datos, nos ha dado hermosos ejemplos a través de la historia: el famoso gráfico de C. J. Minard sobre la marcha de la Armada napoleónica sobre Moscú (¡realizado en 1869!) o, más recientemente, la combinación de número de testeos, cantidad de casos diarios, índice de positividad, país y continente durante toda la evolución de la pandemia de COVID-19 realizado por ourworldindata.org.

texto alternativo
“Mapa figurativo de las sucesivas pérdidas de hombres de la Armada Francesa en la campaña de Rusia 1812-1813”, de Charles J. Minard (1869).

texto alternativo\

Fuente: Our World in Data (fecha de datos)
https://ourworldindata.org/grapher/covid-19-daily-tests-vs-daily-new-confirmed-cases-per-million

Noten la escala logarítmica (en ambos ejes) en el último gráfico. Eligieron esa escala porque los datos que quieren visualizar varían en un rango muy grande en ambos ejes. El otro motivo por el cual conviene elegir escala logarítmica es que nos permite “descubrir” patrones de crecimiento que en escala lineal son difíciles de distinguir, pero eso es el tema de otra nota que podés ver aquí.

Para seguir pensando

Es bueno darse cuenta de que podemos usar la matemática como una herramienta: si respetamos sus reglas, podemos hacer las cosas de la manera que más nos convenga. En cierto sentido es empoderante. No estamos forzados a ubicar valores de manera equiespaciada en la recta numérica… es solo una manera posible que sirve para ciertos propósitos. Hay otras maneras de elegir la escala; por ejemplo, se puede usar el logaritmo en base 2 en vez de base 10, o ubicar los números de manera tal que sus valores al cuadrado queden equiespaciados. Podés encontrar más ejemplos al respecto si buscás en la web artículos referidos a “linealización de datos”.