edición digital para la biblioteca digital del...
TRANSCRIPT
2
Edición digital para la Biblioteca Digital del ILCE
Título original: An Introduction to Mathematics
© De la traducción: Emilio Méndez Pinto
Primera edición: Williams & Norgate, 1910
D. R. © Williams & Norgate, 1910
ISBN: B000L5WA8O
Prohibida su reproducción por cualquier medio mecánico o
eléctrico sin la autorización por escrito de los coeditores.
3
CAPÍTULO I
LA NATURALEZA ABSTRACTA DE LAS MATEMÁTICAS
El estudio de las matemáticas es propicio para comenzar en decepción. Las
importantes aplicaciones de la ciencia, el interés teórico de sus ideas, y el rigor lógico
de sus métodos, generan la expectativa de una rápida introducción a los procesos de
mayor interés. Se nos dice que con su ayuda se pesan las estrellas y se cuentan los
billones de moléculas en una gota de agua. Aun así, como el fantasma del padre de
Hamlet, esta gran ciencia elude los esfuerzos de nuestras armas mentales para
comprenderla - “está aquí, está aquí, se ha ido”* - y lo que vemos no nos sugiere la
misma excusa de ilusión que fue suficiente para el fantasma, a saber, que algo es
demasiado noble para nuestros primitivos o brutos métodos. “Una exposición de
violencia”, podría decirse, es lo que “ofrecen” los resultados triviales que ocupan las
páginas de algunos tratados de matemáticas elementales.
La razón de esta falla de la ciencia para hacer notar su reputación es que sus
ideas fundamentales no son explicadas al estudiante de forma separada a los
procedimientos técnicos que fueron inventados para facilitar su exacta presentación en
casos particulares. De acuerdo con esto, el desdichado estudiante se encuentra luchando
para adquirir el conocimiento de una masa de detalles que no son iluminados por
ninguna concepción general. Sin duda alguna, la facilidad técnica es un primer requisito
para una valiosa actividad mental: fracasaríamos al intentar apreciar el ritmo de Milton†,
o la pasión de Shelley‡, si consideráramos necesario deletrear las palabras sin estar
seguros de las formas de las letras individuales. En este sentido no hay un camino real
hacia el aprendizaje. Pero constituye igualmente un error el limitar la atención a los
procesos técnicos, excluyendo la consideración sobre las ideas generales. Aquí yace el
camino a la pedantería.
El objetivo de los siguientes capítulos no es enseñar matemáticas, sino permitir a
los alumnos, desde el principio de sus cursos, saber en qué consiste esta ciencia, y por
* Whitehead alude a las líneas 155-57 del acto 1, escena 1 de la obra de Shakespeare Hamlet. En esta parte de la obra, el fantasma aparece a algunos personajes (Horacio, Bernardo, Marcelo) y de pronto, igual de rápido que aparece, desaparece. Nota del Traductor. † John Milton (1608-1674) poeta inglés. Nota del Traductor ‡ Percy Bysshe Shelley (1792-1822) poeta y ensayista inglés. Nota del traductor.
4
qué son necesarios los fundamentos del pensamiento exacto cuando éste es aplicado a
los fenómenos naturales. Toda alusión en lo que sigue a deducciones detalladas sobre
cualquier parte de esta ciencia será introducida solamente para propósitos de
ejemplificar, y se tendrá cuidado para hacer que el argumento general sea comprensible,
incluso si algunos procesos técnicos y algunos símbolos que el lector no comprenda son
citados como tentativa de ilustración.
El primer conocimiento que la mayoría de las personas tienen con las
matemáticas se da a partir de la aritmética. Que dos y dos hacen cuatro es usualmente
tomado como una simple proposición matemática sobre la que cualquiera ha escuchado.
La aritmética, por lo tanto, es un buen tema a considerar para descubrir, si es posible, la
más obvia característica de esta ciencia. Ahora bien, el primer hecho notable sobre la
aritmética es que ésta se aplica a todo, a sabores y a sonidos, a manzanas y a ángeles, a
las ideas de la mente y a los huesos del cuerpo. La naturaleza de las cosas es
perfectamente indiferente, porque para todas las cosas es verdad que dos y dos hacen
cuatro. Así, debemos hacer notar que la principal característica de las matemáticas es
que trata con propiedades e ideas que son aplicables a las cosas sólo por el hecho de ser
cosas, e independientemente de cualquier sentimiento, emoción o sensación particular,
en cualquier modo conectado con ellas. Esto es lo que se entiende al llamar a las
matemáticas una ciencia abstracta.
El resultado al que hemos llegado requiere de atención. Es natural pensar que
una ciencia abstracta no puede ser de mucha importancia para los asuntos de la
existencia humana, porque ha omitido considerar todas las cosas de interés real. Debe
ser recordado que Swift, en su descripción del viaje de Gulliver a Laputa, tiene dos
perspectivas sobre este punto. Describe a los matemáticos de ese país como tontos e
inútiles soñadores, cuya atención debe ser continuamente despertada por las mujeres.
También, el sastre matemático mide su altura con un cuadrante, y deduce sus otras
dimensiones con una regla y un compás, produciendo trajes con ajustes defectuosos. Por
otra parte, los matemáticos de Laputa, debido a su magnífica invención de una isla
magnética flotando en el aire, gobiernan el país y mantienen el poder sobre los otros
pobladores. Swift, de hecho, vivió en una época completamente inadecuada para
burlarse de las matemáticas contemporáneas. Los Principios de Newton se acababan de
escribir, uno de los grandes impulsos que han transformado el mundo moderno. Swift
podría también haberse reído en un terremoto.
5
Pero una simple lista de los logros de las matemáticas no es suficiente para
entender su importancia. Vale la pena pensar en la razón principal de por qué las
matemáticas, debido a su carácter abstracto, deben ser siempre consideradas como una
de las más importantes cuestiones del pensamiento. Intentemos hacer evidente por qué
las explicaciones del orden de los eventos necesariamente tienden a ser matemáticas.
Consideremos cómo todos los eventos están interconectados. Cuando vemos el
relámpago, escuchamos el trueno; cuando escuchamos el viento, vemos las olas del mar;
en el frío otoño, vemos las hojas caer. En todos lados el orden reina, así que cuando
algunas circunstancias han sido notadas, podemos prever que otras también estarán
presentes. El progreso de la ciencia consiste en observar estas interconexiones y en
demostrar, con una ingenuidad paciente, que los eventos de este siempre cambiante
mundo no son sino ejemplos de unas pocas conexiones o relaciones generales llamadas
leyes. Observar qué es general en lo particular y qué es permanente en lo transitorio es
el objetivo del pensamiento científico. Bajo el ojo de la ciencia, la caída de una
manzana, el movimiento de un planeta alrededor del sol, y el aferre de la atmósfera a la
Tierra, son vistos como ejemplos de la ley de la gravedad. Esta posibilidad de
desenvolver las más complejas y evanescentes circunstancias en varios ejemplos de
leyes permanentes constituye la idea que rige al pensamiento moderno.
Ahora pensemos en el tipo de leyes que queremos a fin de que se realice este
ideal científico. Nuestro conocimiento de los hechos particulares del mundo lo
obtenemos de nuestras sensaciones. Nosotros vemos, y escuchamos, y probamos, y
olemos, y sentimos lo caliente y lo frío, y empujamos, y frotamos, y sentimos dolor y
comezón. Estas son sólo nuestras sensaciones personales: mi dolor de muelas no puede
ser tu dolor de muelas, y mi vista no puede ser tu vista. Pero nosotros atribuimos el
origen de estas sensaciones a relaciones entre las cosas que forman el mundo externo.
Así, el dentista no extrae el dolor de muela, sino la muela. Y no solamente eso, sino que
también nos empeñamos en imaginar al mundo como un conectado conjunto de cosas
que subyacen en todas las percepciones de todas las personas. No existe un mundo de
cosas para mis sensaciones y otro para las tuyas, sino un mundo en el que ambos
existimos. Es la misma muela para el paciente y para el dentista. También escuchamos y
tocamos el mismo mundo que ambos vemos.
Es fácil, por lo tanto, entender que queremos describir las conexiones entre estas
cosas externas en algún modo que no dependan de sensaciones particulares, ni de todas
las sensaciones de alguna persona en particular. Las leyes satisfechas por el curso de los
6
eventos en el mundo de las cosas externas deben ser descritas, si es posible, en una
forma neutral y universal, lo mismo para los ciegos que para los sordos, y lo mismo
para los seres con facultades mayores que las nuestras que para seres normales.
Pero cuando hemos dejado de lado nuestras sensaciones inmediatas, la parte más
útil - debido a su claridad, capacidad de definición y universalidad - que nos queda se
compone de nuestras ideas generales de las propiedades formales y abstractas de las
cosas; de hecho, de las ideas matemáticas abstractas mencionadas arriba. Así, ha
sucedido entonces que, paso por paso y sin darse cuenta del significado total del
proceso, la humanidad ha llevado a cabo la búsqueda de una descripción matemática de
las propiedades del universo, porque de este modo es como se puede tener una idea
general del curso de los eventos, libre de referencia a personas particulares o a tipos
particulares de sensación. Por ejemplo, podría preguntarse en una cena: “¿Qué es lo que
subyace en mi sensación de vista, en la tuya de tacto, y en la suya de gusto y olor?”,
siendo la respuesta “una manzana”. Pero en su análisis final, la ciencia busca describir
una manzana en términos de las posiciones y movimientos de las moléculas, una
descripción que nos ignora a mí, a ti y a cualquiera, y que también ignora a la vista, al
tacto, al sabor y al olor. De esta forma, las ideas matemáticas, debido a que son
abstractas, suministran lo que es querido por una descripción científica del curso de los
eventos.
Este punto ha sido usualmente mal comprendido, porque ha sido pensado de una
manera demasiado estricta. PITÁGORAS tuvo un vislumbre de él cuando proclamó que
el número era la fuente de todas las cosas. En los tiempos modernos la creencia de que
la explicación definitiva de todas las cosas se encuentra en la mecánica newtoniana fue
un presagio de la verdad de que toda ciencia que evoluciona hacia la perfección se
vuelve matemática en sus ideas.
7
CAPÍTULO II
VARIABLES
Las matemáticas comenzaron a ser ciencia cuando alguien, probablemente un
griego, probó proposiciones sobre cualquier o sobre algunas cosas, sin especificaciones
definidas de cosas particulares. Estas proposiciones fueron primeramente enunciadas
por los griegos para la geometría; y, de acuerdo con esto, la geometría fue la gran
ciencia matemática griega. Después del nacimiento de la geometría, pasaron siglos para
que el álgebra empezara a desenvolverse como rama fundamental de las matemáticas, a
pesar del hecho de que algunos matemáticos griegos hicieron algunas tenues
anticipaciones de la materia.
Las ideas de cualquier y algunos son introducidas en el álgebra usando letras, en
lugar de los números definidos de la aritmética. De esta forma, en lugar de decir que
2+3=3+2, en el álgebra generalizamos y decimos que, si x e y representan a cualesquiera
dos números, entonces x+y=y+x. De nuevo, en lugar de decir que 3>2, generalizamos y
decimos que si x es cualquier número, existe algún número (o números) y tal que y>x.
Podemos observar de paso que esta última suposición - cuando es presentada en su
forma final - es una suposición de vital importancia, tanto para la filosofía como para las
matemáticas, porque por ella la noción del infinito es introducida. Tal vez esta
suposición requirió de la introducción de los números arábigos, gracias a lo cual el uso
de letras como representantes de números definidos ha sido completamente descartado
en las matemáticas, a fin de que se muestre a los matemáticos la conveniencia técnica
del uso de letras para las ideas de cualquier número y de algún número. Los romanos
hubieran establecido el número del año en que esto fue escrito en la forma MDCCCCX,
mientras que nosotros lo escribimos como 1910, dejando las letras para otros usos. Pero
esto es simplemente una especulación. Después del nacimiento del álgebra, el cálculo
diferencial fue inventado por NEWTON y por LEIBNIZ, y después hubo una pausa en
el progreso de la filosofía del pensamiento matemático en lo que a estas nociones
concierne; y ha sido en los últimos años cuando se ha visto cuan fundamentales las
nociones de cualquier y alguno son para la naturaleza de las matemáticas, con el
consiguiente resultado de dar paso a nuevos temas para la exploración matemática.
8
Hagamos ahora algunas simples declaraciones algebraicas, con el objetivo de
comprender de manera exacta cómo es que estas ideas fundamentales tienen lugar.
(1) Para cualquier número x, x+2=2+x;
(2) Para algún número x, x+2=3;
(3) Para algún número x, x+2>3.
El primer punto a destacar es el de las posibilidades contenidas en el significado
de algún, como se usa aquí. Como x+2=2+x para cualquier número x, es verdad para
algún número x. Así, como usamos aquí, algún no excluye a cualquiera. De nuevo, en
el segundo ejemplo, existe, de hecho, solamente un número x, tal que x+2=3, a saber,
solamente el número 1. Así, algún puede ser solamente un número. Pero en el tercer
ejemplo, cualquier número x que sea más grande que 1 resulta en x+2>3. Por lo tanto
hay un número infinito de números que responden a algún número en este caso.
Entonces algún puede ser cualquier cosa entre cualquier y solamente uno, incluyendo a
estos dos limitados casos.
Es natural reemplazar las declaraciones (2) y (3) por las preguntas:
(2’) Para qué número x es x+2=3;
(3’) Para qué números x es x+2>3.
Considerando a (2’), 32 =+x es una ecuación, y es fácil ver que su solución es
123 =−=x . Cuando hemos hecho la pregunta implícita en la declaración de la
ecuación 32 =+x , x es llamada una incógnita. El objetivo de la solución de la ecuación
es la determinación de la incógnita. Las ecuaciones son de gran importancia para las
matemáticas, y parece como si (2’) ejemplificara una idea más completa y fundamental
que la idea de la declaración original (2). Esto, sin embargo, es un completo error. La
idea de la “variable” indeterminada, como ocurre con el uso de “algún” y “cualquier”,
es la realmente importante en las matemáticas; aquella idea de la “incógnita” en una
ecuación, que tiene que ser resuelta lo más rápido posible, es sólo para un uso
subordinado, aunque por supuesto es muy importante. Una de las causas de la aparente
trivialidad de gran parte del álgebra elemental es la preocupación de los libros de texto
por la solución de ecuaciones. La misma observación aplica a la solución de la
desigualdad (3’) en comparación con la declaración original (3).
Pero la mayoría de las fórmulas interesantes, especialmente cuando la idea de
algún está presente, involucran a más de una variable. Por ejemplo, la consideración de
los pares de números x e y (fraccionarios o integrales) que satisfacen x+y=1 implica la
idea de dos variables correlacionadas, x e y. Cuando dos variables están presentes,
9
ocurren los mismos dos tipos principales de declaración. Por ejemplo, (1) para
cualquier par de números, x e y, x+y=y+x, y (2) para algunos pares de números, x e y,
x+y=1.
El segundo tipo de declaración invita a la consideración sobre el agregado de los
pares de números que son unidos por alguna relación fija - en el caso dado, por la
relación x+y=1. Un uso de las fórmulas del primer tipo, verdadero para cualquier par de
números, es que por ellos (el uso de las fórmulas del primer tipo) las fórmulas del
segundo tipo pueden ser expuestas en un número indefinido de formas equivalentes. Por
ejemplo, la relación x+y=1 es equivalente a las relaciones
y+x=1, )( yx − +2y=1, 6x+6y=6,
etcétera. Así, un matemático hábil usa esa forma equivalente de relación que es la más
conveniente para su propósito inmediato.
No es en general verdadero que, cuando un par de términos satisface alguna
relación fija, si uno de los términos es dado, el otro es también definitivamente
determinado. Por ejemplo, cuando x e y satisfacen y2=x, si x=4, y puede ser ± 2, así,
para cualquier valor positivo de x existen valores alternativos para y. También en la
relación x+y>1, cuando o x o y son dadas, un número indefinido de valores permanece
abierto para el otro.
Hay otro punto importante que debe ser notado. Si nos restringimos a los
números positivos, ya sean integrales o fraccionales, al considerar la relación x+y=1,
entonces, si x o y son mayores a 1, no existe ningún número positivo que el otro pueda
asumir para satisfacer la relación. De esta forma, el “campo” de la relación para x está
restringido a números menores que 1, y similarmente para el “campo” abierto a y. De
nuevo, consideremos los números integrales solamente, ya sean positivos o negativos, y
tomemos la relación y2=x, satisfecha por pares de tales números. Entonces cualquier
valor integral que sea dado a y, x puede asumir un valor integral correspondiente. Así
que el “campo” para y es irrestricto entre estos enteros positivos o negativos. Pero el
“campo” para x está restringido en dos formas. En primer lugar, x tiene que ser positivo,
y, en segundo lugar, como y es un integral (o entero), x debe ser un cuadrado perfecto.
De acuerdo con esto, el “campo” para x está restringido al conjunto de enteros 12, 22, 32,
42, etcétera, por ejemplo, a 1, 4, 9, 16, etcétera.
El estudio de las propiedades generales de una relación entre pares de números
es sumamente facilitado por el uso de un diagrama construido así:
10
Fig. 1
Dibuja dos líneas 0X y 0Y en ángulos rectos; sea cualquier número x
representado por x unidades (en cualquier escala) de longitud a lo largo de 0X, cualquier
número y representado por y unidades (en cualquier escala) de longitud a lo largo de 0Y.
Así, si 0M, a lo largo de 0X, es x unidades en longitud, y 0N, a lo largo de 0Y, es y
unidades en longitud, al completar el paralelogramo 0MPN encontramos un punto P que
corresponde al par de números x e y. Para cada punto de ahí corresponde un par de
números, y para cada par de números de ahí corresponde un punto. El par de números
son llamados coordenadas del punto. Entonces los puntos cuyas coordenadas satisfacen
alguna relación fija pueden ser indicados en una forma conveniente, al dibujar una línea,
si todos ellos se encuentran en una línea, o al sombrear un área si todos ellos son puntos
en un área. Si la relación puede ser representada por una ecuación tal como x+y=1, o
y2=x, entonces los puntos se encuentran en una línea, que es recta en el primer caso y
curva en el último. Por ejemplo, considerando solamente números positivos, los puntos
cuyas coordenadas satisfacen x+y=1 se encuentran en la línea recta AB en la Fig. 1,
donde 0A=1 y 0B=1. Este segmento de la línea recta AB da una representación pictórica
de las propiedades de la relación bajo la restricción a los números positivos.
Otro ejemplo de una relación entre dos variables se consigue al considerar las
variaciones en la presión y en el volumen de una masa dada de alguna sustancia gaseosa
- tal como el aire, el gas-carbón, o el vapor - en una temperatura constante. Sea v el
11
número de pies cúbicos en su volumen y p su presión en libras de peso por pulgada
cuadrada. Entonces la ley, conocida como la ley de BOYLE, expresando la relación
entre p y v cuando ambas varían, es que el producto pv es constante, suponiendo
siempre que la temperatura no se altera. Supongamos, por ejemplo, que la cantidad de
gas y sus otras circunstancias son tales que podemos poner pv=1 (el número exacto en el
lado derecho de la ecuación no constituye una diferencia esencial).
Fig. 2 Entonces en la Fig. 2 tomamos dos líneas, 0V y 0P, en ángulos rectos y
dibujamos 0M a lo largo de 0V para representar v unidades de volumen, y 0N a lo largo
de 0P para representar p unidades de presión. Entonces el punto Q, que se obtiene al
completar el paralelogramo MONQ, representa el estado del gas cuando su volumen es
v pies cúbicos y su presión es p peso de libras por pulgada cuadrada. Si las
circunstancias de la porción de gas considerada son tales que pv=1, entonces todos estos
puntos Q que corresponden a cualquier estado posible de esta porción de gas deben
situarse en la línea curva ABC, que incluye todos los puntos para los cuales p y v son
positivos, y pv=1. Esta línea curva da una representación pictórica de la relación entre el
volumen y la presión. Cuando la presión es muy grande el correspondiente punto Q
debe estar cerca de C, o incluso más allá de C en la parte no dibujada de la curva;
entonces el volumen será muy pequeño. Cuando el volumen es grande Q estará cerca de
A, o más allá de A; y entonces la presión será pequeña. Nótese que un ingeniero o un
12
físico podrían querer saber la presión particular correspondiente a algún volumen
definitivo asignado. Entonces tenemos que determinar la incógnita p cuando v sea un
número conocido. Pero esto sólo sucede en casos particulares. Al considerar de manera
general las propiedades del gas y cómo se comportará, solamente tiene que tener en
mente la forma general de toda la curva ABC y sus propiedades generales. En otras
palabras, la idea realmente fundamental es la del par de variables que satisfacen la
relación pv=1. Este ejemplo ilustra cómo la idea de variables es fundamental, tanto en
las aplicaciones como en la teoría de las matemáticas.
13
CAPÍTULO III
MÉTODOS DE APLICACIÓN
Merece la pena pensar en la forma en la que la idea de las variables satisfaciendo
una relación ocurre en la aplicación de las matemáticas, y el dedicar un tiempo a esta
cuestión nos puede ayudar a aclarar nuestros pensamientos sobre el tema.
Empecemos con el ejemplo más simple posible:
Supongamos que los costos de construcción son 1s. por pie cúbico y que 20s.
son £1. En todas las circunstancias complejas que atañen a la construcción de una nueva
casa, entre las que se encuentran las sensaciones y emociones del dueño, del arquitecto,
del constructor, de los trabajadores, de los espectadores, mientras la casa es construida
hasta el final, esta fija correlación se da, por la ley asumida, entre el contenido cúbico y
el costo para el dueño, es decir, que si x es el número de pies cúbicos, y £y el costo,
entonces 20y=x. Esta correlación de x e y está supuesta para ser verdadera para la
construcción de cualquier casa por cualquier dueño. También el volumen de la casa y el
costo no están supuestos a ser percibidos o aprehendidos a partir de cualquier sensación
o facultad particular, ni por cualquier hombre particular. Están establecidos bajo una
forma general y abstracta, con completa indiferencia hacia el estado mental del dueño
cuando éste tiene que pagar la cuenta.
Ahora pensemos un poco más en todo lo que esto significa. La construcción de
una casa implica un complicado conjunto de circunstancias. Es imposible empezar a
aplicar la ley, o incluso probarla, a menos que en el curso general de los eventos sea
posible reconocer un conjunto definido de sucesos que constituyan un caso particular de
la construcción de la casa. En otras palabras, debemos reconocer una casa cuando la
vemos, y debemos reconocer los eventos que atañen a su construcción. Después, de
entre todos estos eventos, aislados en teoría del resto de la naturaleza, los dos elementos
del costo y del contenido cúbico deben ser determinables; y cuando ambos son
determinados, si la ley es cierta, deben de satisfacer la fórmula general
20y=x.
14
¿Pero es verdadera esta ley? Cualquiera que haya estado involucrado de alguna u otra
forma en la construcción de casas reconocerá que hemos puesto un costo demasiado
alto. Este precio solamente sería justo para un tipo muy caro de casa. Esto nos lleva a
considerar otra cuestión que debe ser aclarada. Cuando hacemos cálculos matemáticos
conectados con la fórmula 20y=x, nos es indiferente si la ley es verdadera o falsa. De
hecho, los significados asignados a x y a y, como un número de pies cúbicos y un
número de libras esterlinas, son indiferentes. Durante la investigación matemática
estamos simplemente considerando las propiedades de esta correlación entre un par de
números variables x e y. Nuestros resultados se aplicarán igualmente bien, si
interpretamos que y significa un número de pescadores y x el número de peces
capturados, de modo que la ley supuesta es que, en promedio, cada pescador captura
veinte peces. La certeza matemática de la investigación atañe solamente a los resultados
considerados al dar propiedades a la correlación 20y=x entre el par variable de números
x e y. No existe certeza matemática alguna acerca del costo de la construcción de
ninguna casa. La ley no es muy cierta y el resultado que da no es muy preciso. De
hecho, puede ser irremediablemente falso.
Ahora todo esto parece sin duda muy obvio. Pero en verdad, con casos más
complicados, no existe error más común que asumir que, debido a que se han hecho
prolongados y precisos cálculos matemáticos, la aplicación del resultado a algún hecho
de la naturaleza es absolutamente certera. La conclusión de ningún argumento puede ser
más certera que las suposiciones a partir de las cuales comienza. Todos los cálculos
matemáticos acerca del curso de la naturaleza deben partir de alguna ley asumida sobre
la naturaleza, parecida, por ejemplo, a la supuesta ley del costo de construcción
expresada arriba. De acuerdo con esto, por más que hayamos calculado de manera
precisa que algún evento debe ocurrir, la duda siempre queda: ¿Es verdadera esta ley?
Si la ley establece un resultado preciso, casi seguro que no es precisamente exacta; y
así, incluso en el mejor de los resultados, precisos según los cálculos, no es probable
que se produzca un resultado fiel. Pero esto significa que no tenemos una facultad capaz
de observar con una precisión ideal. Pero, después de todo, nuestras inexactas leyes
pueden ser suficientemente buenas.
Ahora pondremos nuestra atención en un caso real: NEWTON y la ley de la
gravedad. Esta ley establece que, cualesquiera dos cuerpos, se atraen entre sí con una
fuerza proporcional al producto de sus masas e inversamente proporcional al cuadrado
de la distancia entre ellos. Así, si m y M son las masas de los dos cuerpos, calculadas en
15
libras, por ejemplo, y d millas es la distancia entre ellos, la fuerza en uno u otro cuerpo,
debida a la atracción del otro dirigida hacia uno u otro, es proporcional a 2d
mM; en
consecuencia esta fuerza puede ser escrita como 2d
kmM, donde k es un número definido
dependiendo de la magnitud absoluta de esta atracción y también de la escala por la cual
escogemos medir las fuerzas. Es fácil ver que, si queremos calcular en términos de
fuerzas tales como el peso de una masa de 1 libra, el número que k representa debe ser
extremadamente pequeño; porque cuando m y M y d son cada una puestas igual a 1,
2d
kmM se convierte en la atracción gravitacional de dos masas iguales de 1 libra, a una
distancia de una milla, y esto es prácticamente inapreciable.
Sin embargo, hemos obtenido la fórmula para la fuerza de atracción. Si
llamamos a esta fuerza F, esto es F=k2d
mM, dada la correlación entre las variables F, m,
M y d. Todos conocemos la historia de cómo esto se descubrió. NEWTON, se dice,
estaba sentado en un huerto y observó la caída de una manzana, y entonces la ley de la
gravitación universal irrumpió en su mente. Puede ser que la formulación final de la ley
se le ocurrió en un huerto, así como también en otro lado - y tuvo que haber sido en otro
lado -. Pero para nuestros propósitos es más instructivo lidiar con la vasta cantidad de
pensamiento preparatorio, el producto de muchas mentes y muchos siglos, antes de que
esta exacta ley pudiera ser formulada. En primer lugar, el hábito matemático de la mente
y el procedimiento matemático explicado en los dos capítulos anteriores tuvo que haber
sido generado; de otra manera NEWTON nunca hubiera podido pensar en una fórmula
que representara la fuerza entre cualesquiera dos masas a cualquier distancia. Por otra
parte, ¿cuáles son los significados de los términos empleados: fuerza, masa, distancia?
Tomemos el más simple de estos términos, la distancia. Parece muy obvio para nosotros
el concebir todas las cosas materiales como formando un todo geométrico definido, tal
que las distancias de las distintas partes son medibles en términos de alguna medida de
longitud: una milla, una yarda, un metro. Este es prácticamente el primer aspecto de una
estructura material que nos está presente. Es el resultado gradual del estudio de la
geometría y de la teoría de la medición. Incluso ahora, en algunos casos, otros modos de
pensamiento son convenientes. En un país montañoso, por ejemplo, las distancias son
comúnmente medidas en horas. Pero dejando a un lado la distancia, los otros términos,
16
fuerza y masa, son mucho más oscuros. La exacta comprensión de las ideas que
NEWTON quería expresar y transmitir por estas palabras fue sumamente lenta y, en
realidad, NEWTON fue el primer hombre que dominó a fondo los principios generales
de la dinámica.
A lo largo de la Edad Media, bajo la influencia de ARISTÓTELES, la ciencia
era totalmente errónea. NEWTON tuvo la ventaja de aparecer después de una serie de
grandes hombres, especialmente GALILEO, en Italia, quien en los dos siglos anteriores
había reconstruido la ciencia y había inventado el modo correcto de pensar sobre ella.
NEWTON completó el trabajo de estos hombres. Después, finalmente, teniendo las
ideas de fuerza, masa y distancia de manera clara y distinta en su mente*, y consciente
de la importancia y relevancia de estas ideas a la caída de una manzana y a los
movimientos de los planetas, se le ocurrió la ley de la gravitación y probó que ésta era la
fórmula siempre satisfecha en estas distintas proposiciones.
El punto vital en la aplicación de las fórmulas matemáticas es tener ideas claras
y una estimación correcta de su relevancia a los fenómenos bajo observación. No menos
que nosotros, nuestros remotos ancestros estaban impresionados con la importancia de
los fenómenos naturales y con la atractiva posibilidad de tomar medidas enérgicas para
regular la secuencia de los eventos. Bajo la influencia de ideas irrelevantes elaboraron
ceremonias religiosas para ayudar al nacimiento de la nueva luna, y realizaron
sacrificios para salvar al sol durante la crisis de un eclipse. No existe ninguna razón para
pensar que ellos eran más estúpidos de lo que nosotros somos. Pero en esa época no
había oportunidad alguna para una lenta acumulación de ideas claras, distintas y
relevantes.
El tipo de camino por el cual las ciencias físicas se convierten en una forma
capaz de ser tratada por métodos matemáticos está ilustrado por la historia del
crecimiento gradual del electromagnetismo. Las tormentas eléctricas son eventos a gran
escala, que despiertan miedo en hombres y animales. Desde los primeros tiempos deben
haber sido objeto de locas y fantásticas hipótesis, aunque se puede dudar acerca de si
nuestros modernos descubrimientos científicos en conexión con la electricidad no son
más excéntricos que cualquiera de las explicaciones mágicas de los salvajes. Los
griegos sabían que el ámbar (en griego, electrón), cuando se frotaba, atraía luz y secaba
los cuerpos. En 1600 d. C., el Dr. GILBERT, de Colchester, publicó el primer trabajo
* Whitehead se refiere a la distinción cartesiana entre “ideas claras y distintas” e “ideas oscuras y confusas” en la mente. Nota del Traductor.
17
sobre el tema siguiendo el método científico. Hizo una lista de las sustancias que poseen
propiedades similares a aquellas del ámbar; tuvo también el crédito de haber conectado,
aunque sea de manera vaga, los fenómenos eléctricos y magnéticos. Al final del siglo
diecisiete y a lo largo del siglo dieciocho el conocimiento sobre este tema avanzó de
manera significativa. Se crearon máquinas eléctricas, de donde se obtenían chispas; y la
botella de Leyden* fue inventada, por lo que estos efectos fueron intensificados. Se
había llegado a un conocimiento organizado, pero todavía no habían sido descubiertas
ideas matemáticas relevantes sobre el tema. Franklin, en el año 1752, envió un cometa a
las nubes y probó que las tormentas eran eléctricas.
En el año 2634 a. C., los chinos utilizaban brújulas, pero nunca relacionaron su
uso con ideas teóricas. Los cambios realmente profundos en la vida humana han tenido
su origen en el conocimiento pensado como un fin en sí mismo. La brújula no fue
introducida en Europa hasta el final del siglo doce d. C., más de 3000 años después de
su primer uso en China. La importancia que la ciencia del electromagnetismo ha tenido
en cada rubro de la vida humana no se debe a una orientación práctica superior de los
europeos con respecto a los chinos, sino al hecho de que en occidente los fenómenos
eléctricos y magnéticos fueron estudiados por hombres dominados por intereses
abstractos y teóricos.
El descubrimiento de la corriente eléctrica se debe a dos italianos, GALVANI en
1780, y VOLTA en 1792. Este gran descubrimiento permitió estudiar bajo una nueva
perspectiva un número considerable de fenómenos. El mundo científico tenía ahora tres
separados, aunque relacionados, grupos de casos a la mano: los efectos de la
electricidad “estática” derivados de las máquinas eléctricas friccionales, el fenómeno
magnético, y los efectos causados por las corrientes eléctricas. Desde el final del siglo
dieciocho en adelante, estas tres líneas de investigación fueron rápidamente
interconectadas, y, de esta forma, la ciencia moderna del electromagnetismo fue
construida, e intenta ahora transformar la vida humana.
Aparecieron entonces las ideas matemáticas. Durante la década que va de 1780 a
1789, COULOMB†, en Francia, probó que los polos magnéticos se atraen o repelen
entre ellos en proporción al cuadrado inverso de sus distancias, y también que la misma
ley es válida para las cargas eléctricas - leyes curiosamente análogas a la de la
* Botella de vidrio que sirve como aparato para almacenar cargas eléctricas. Nota del Traductor. † Charles-Augustin de Coulomb (1736-1806). Físico e ingeniero francés. Nota del Traductor.
18
gravitación -. En 1820, OERSTED*, en Dinamarca, descubrió que las corrientes
eléctricas ejercen una fuerza sobre los imanes, casi inmediatamente después de que la
ley matemática de la fuerza fuera correctamente formulada por AMPÈRE, en Francia,
quien también probó que dos corrientes eléctricas ejercen fuerzas una sobre la otra. “La
investigación experimental por la cual AMPÈRE estableció la ley de la acción
mecánica entre las corrientes eléctricas es uno de los logros más brillantes de la
ciencia. Todo, teoría y experimento, parecen haber surgido, de manera completa y
armada, del cerebro del “Newton de la electricidad”. Es perfecta en forma, e
inatacable en precisión, y está expuesta en una fórmula a partir de la cual todos los
fenómenos pueden ser deducidos, y que debe siempre permanecer como la fórmula
principal de la electro-dinámica”.†
Las importantes leyes de inducción entre las corrientes y entre las corrientes y
los imanes fueron descubiertas por Michael FARADAY en 1831-32. A FARADAY se
le preguntó “¿Cuál es el uso de este descubrimiento?” y respondió “Cuál es el uso de un
niño: crecer para ser un hombre”. El niño de FARADAY creció y es ahora la base de
todas las aplicaciones modernas de la electricidad. FARADAY también reorganizó toda
la concepción teórica de esta ciencia. Sus ideas, que no han sido totalmente
comprendidas por el mundo científico, fueron extendidas y expresadas bajo una forma
matemática por CLERK MAXWELL en 1873. Como resultado de sus investigaciones
matemáticas, MAXWELL reconoció que, bajo ciertas condiciones, las vibraciones
eléctricas deben ser propagadas. Incluso una vez sugirió que las vibraciones que forman
la luz son eléctricas: esta sugerencia ha sido verificada, y ahora toda la teoría sobre la
luz es solamente una rama de la gran ciencia de la electricidad. También HERZ, en
Alemania, logró producir vibraciones eléctricas a partir de métodos eléctricos directos.
Sus experimentos son la base del telégrafo sin hilos.
En años más recientes, se han hecho nuevos descubrimientos fundamentales, y la
ciencia continúa creciendo en importancia teórica y en interés práctico. Este rápido
bosquejo de su progreso ilustra cómo, debido a la introducción gradual de ideas teóricas
relevantes, surgidas por experimentos y a su vez produciendo experimentos, hizo
posible que una masa de aislados e incluso triviales fenómenos estén ahora unidos en
una ciencia coherente, y en la cual los resultados de las abstractas deducciones
* Hans Christian Oersted (1777-1851). Físico y químico danés. Nota del Traductor. † Electricity and Magnetism, Clerk Maxwell, vol. II, cap. Iii.
19
matemáticas, comenzando desde una pocas leyes asumidas, suministraron la explicación
al complejo enredo del curso de los eventos.
Finalmente, yendo más allá de las ciencias particulares del electromagnetismo y
de la luz, podemos generalizar nuestro punto de vista aún más, y dirigir nuestra atención
al desarrollo de la física matemática, considerada como uno de los grandes hitos del
pensamiento científico. En primer lugar, ¿cuál es, en líneas generales, la historia de este
desarrollo?
La física matemática no comenzó como una ciencia, y tampoco fue el producto
de un grupo de hombres. Los pastores observaron los cielos, los burócratas del gobierno
en Mesopotamia y Egipto midieron las tierras, y los sacerdotes y los filósofos se
preguntaban acerca de la naturaleza de todas las cosas. La vasta masa de las operaciones
de la naturaleza aparecía como un conjunto de fuerzas misteriosas e indescifrables. “El
viento sopla cuando quiere soplar”* expresa la ignorancia sobre la existencia de reglas
estables surgidas de la sucesión de los fenómenos. Como ahora, la regularidad de los
eventos era patente. Pero no era posible establecer una interconexión entre ellos, y por
lo tanto no existía el conocimiento suficiente como para construir tal ciencia. Solamente
especulaciones separadas, algunos acercamientos a la naturaleza de las cosas,
constituyeron lo máximo que pudo haber sido producido.
Mientras tanto, las mediciones de la tierra habían producido la geometría, y las
observaciones de los cielos revelaron la regularidad exacta del sistema solar. Algunos
de los últimos sabios griegos, como ARQUÍMEDES, habían expresado puntos de vista
sobre los fenómenos elementales de la hidrostática y la óptica. De hecho,
ARQUÍMEDES, quien combinaba un genio para las matemáticas con una percepción
impresionante para la física, debe ser considerado - junto con NEWTON, quien vivió
dos mil años después - como uno de los fundadores de la física matemática. Vivió en
Siracusa, la gran ciudad griega de Sicilia. Se cuenta que cuando los romanos sitiaron el
lugar (en 210 a 212 d. C.), ARQUÍMEDES quemó sus barcos dirigiendo hacia ellos, a
través de espejos, los rayos del sol. La historia es altamente improbable, pero es sin
duda buena evidencia de la reputación que el genial griego se había ganado entre sus
contemporáneos gracias a sus conocimientos sobre la óptica. Al final de este cerco
romano, fue asesinado. De acuerdo con PLUTARCO, fue encontrado por un soldado
romano mientras estaba absorto en el estudio de un diagrama geométrico que había
* “The wind bloweth where it listeth” Whitehead se refiere al versículo 3:8 del evangelio según San Juan. Nota del Traductor.
20
trazado en el piso arenoso de su cuarto. Al no obedecer de inmediato las órdenes de su
captor, fue asesinado. Para dar crédito a los generales romanos, basta decir que habían
ordenado a los soldados perdonar la vida a ARQUÍMEDES. La evidencia sobre otra
historia de él es mucho más fuerte; porque el descubrimiento atribuido a él es propio de
un hombre con el talento matemático y la capacidad para la física de ARQUÍMEDES.
Por suerte, el descubrimiento es lo suficientemente simple como para ser explicado aquí
a detalle. Es uno de los mejores y más simples ejemplos del método de aplicación de las
ideas matemáticas a la física.
Hierón, rey de Siracusa, había enviado una cantidad de oro a un orfebre para que
formara el material de una corona. Sospechaba que los artesanos habían extraído algo
del oro y lo habían suplantado por otro metal menos valioso. Hierón envió la corona a
ARQUÍMEDES para que comprobara esta sospecha. En nuestros días, un número
indefinido de pruebas químicas hubieran resultado suficientes para estos propósitos.
Pero AQRQUÍMEDES tuvo que pensar sobre el tema sin estos instrumentos. La
solución le vino a la cabeza cuando estaba tomando un baño. Salió del baño y corrió por
las calles del palacio, gritando ¡Eureka! ¡Eureka! (¡Lo he encontrado! ¡Lo he
encontrado!). Este día, si supiéramos en qué fecha fue, debe de ser celebrado como el
día del nacimiento de la física matemática; la ciencia obtuvo su mayoría de edad cuando
NEWTON estaba sentado en la orquídea. ARQUÍMEDES había hecho un gran
descubrimiento. Observó que un cuerpo, cuando está inmerso en agua, es presionado
hacia arriba por el agua que lo rodea con una fuerza resultante igual al peso del agua
que desplaza. Esta ley puede ser teóricamente probada gracias a los principios
matemáticos de la hidrostática, y puede ser también verificada experimentalmente. Por
lo tanto, si W (libras) es el peso de la corona (como pesa en el aire), y w (libras) es el
peso del agua desplazada cuando la corona está completamente inmersa, wW − sería la
fuerza extra hacia arriba necesaria para mantener a la corona mientras se suspende en el
agua.
Ahora, esta fuerza hacia arriba puede ser fácilmente definida de manera precisa
si se pesa el cuerpo mientras se suspende en el agua, como se muestra en la figura tres.
Si
21
Fig. 3
los pesos en la escala de la derecha llegan a F (libras), entonces el peso aparente de la
corona en el agua es F (libras); y entonces tenemos
wWF −=
y entonces FWw −= ,
y w
W=
FW
W
− (A)
donde W y F son determinadas gracias a la fácil y bastante precisa operación de pesar.
Por lo tanto, gracias a la ecuación (A), w
W es conocida. Pero
w
W es la proporción del
peso de la corona al peso de un volumen igual de agua. Esta proporción es la misma
para cualquier pedazo de metal del mismo material: es ahora llamada la gravedad
específica del material, y depende solamente de la naturaleza intrínseca de la sustancia y
no de su forma o cantidad. De esta forma, para probar si la corona era de oro,
ARQUÍMEDES tuvo solamente que tomar un pedazo de oro puro (esta vez,
indiscutiblemente de oro puro) y encontrar su gravedad específica por el mismo
22
proceso. Si las dos gravedades específicas concuerdan, la corona es de oro puro; si no
concuerdan, significa que la corona del rey fue degradada.
Este argumento fue expuesto en toda su extensión, no solamente porque es el
primer ejemplo preciso de la aplicación de ideas matemáticas a la física, sino también
porque constituye un ejemplo perfecto y simple de cuál debe ser el método y el espíritu
científico de cualquier época. El descubrimiento de la teoría de gravedades específicas
es resultado de la mente de un genio de primer rango.
La muerte de ARQUÍMEDES a manos de un soldado romano representa
simbólicamente un cambio de orden mundial de primera magnitud: los teóricos griegos,
con su amor por la ciencia abstracta, fueron sustituidos en el liderazgo del mundo
europeo por los pragmáticos romanos. Benjamin Disraeli*, en una de sus novelas, ha
definido al hombre práctico como el hombre que practica los errores de sus antepasados.
Los romanos fueron una gran civilización, pero estuvieron maldecidos con la esterilidad
que se obtiene del pragmatismo. No mejoraron ni aumentaron el conocimiento de sus
ancestros, y todos sus avances estuvieron confinados a los menores detalles técnicos de
la ingeniería. No fueron lo suficientemente soñadores como para llegar a nuevos puntos
de vista que pudieran haber proporcionado un mayor control sobre las fuerzas de la
naturaleza. Ningún romano perdió su vida por haber estado absorto en la contemplación
de un diagrama matemático.
* También conocido como Lord Beaconsfield (1804-1881), fue un político y escritor británico. Nota del Traductor.
23
CAPÍTULO IV
DINÁMICA
El mundo tuvo que esperar dieciocho siglos para que los físicos matemáticos
griegos encontraran sucesores. En los siglos dieciséis y diecisiete de nuestra era, dos
grandes italianos, LEONARDO DA VINCI (1452-1519) y GALILEO (1564-1642)
redescubrieron el secreto, sabido por ARQUÍMEDES, de relacionar ideas matemáticas
abstractas con la investigación experimental de los fenómenos naturales. Mientras tanto,
el avance lento de las matemáticas y la acumulación de un conocimiento astronómico
exacto y preciso puso a los filósofos naturales en una posición mucho más ventajosa
para la investigación. También la muy egoísta búsqueda de autoafirmación de las
personas, característica de esa época, junto con una codicia por las experiencias
personales, llevó a los pensadores a querer ver, por ellos mismos, lo que sucedía; y el
secreto de la relación entre la teoría matemática y el experimento por razonamiento
inductivo fue descubierto. Fue un suceso eminentemente característico de esa época que
GALILEO, un filósofo, arrojara desde la torre de Pisa los pesos con los que
experimentó. Siempre han existido hombres de pensamiento y hombres de acción; la
física matemática es el producto de una época que combinó, en los mismos hombres,
impulsos hacia el pensamiento e impulsos hacia la acción.
Este hecho de arrojar pesos desde una torre marca pictóricamente un paso
esencial en el conocimiento, no siendo un paso menor a las primeras ideas correctas y
certeras sobre la ciencia de la dinámica, la ciencia básica de todo este tema. El punto
particular de disputa era saber si cuerpos de diferentes pesos caerían, desde la misma
altura, al mismo tiempo. De acuerdo con una sentencia de ARISTÓTELES,
universalmente seguida en esa época, el peso más pesado caería más rápido. GALILEO
afirmó que caerían al mismo tiempo, y probó esto arrojando pesos desde la parte
superior de la torre inclinada. Las aparentes excepciones a la regla surgen cuando, por
alguna razón (ligereza extrema o gran velocidad), la resistencia del aire es importante.
Pero quitando al aire, la ley es exacta.
El exitoso experimento de GALILEO no fue el resultado de meras suposiciones
con un poco de suerte. Fue el resultado, más bien, de sus ideas correctas en relación con
la inercia y la masa. La primera ley del movimiento - la enunciaremos siguiendo a
24
NEWTON - es: cada cuerpo continúa en estado de reposo o de movimiento uniforme en
una línea recta, excepto cuando se ve obligado, por una fuerza impresa sobre él, a
cambiar de estado. Esta ley es más que una simple fórmula: es también un himno al
triunfo sobre los herejes derrotados. El punto en cuestión puede ser mejor entendido si
borramos de la ley la frase: “o de movimiento uniforme en una línea recta”. Entonces
podríamos obtener lo que quiere decir la contraria fórmula aristotélica: “Cada cuerpo
continúa en su estado de reposo, excepto cuando se ve obligado, por una fuerza impresa
sobre él, a cambiar de estado”.
En esta última fórmula falsa se asegura que, sin tomar en cuenta la fuerza, un
cuerpo continúa en un estado de reposo; de acuerdo con esto, si un cuerpo está en
movimiento, es porque una fuerza está manteniendo ese movimiento, de manera que,
cuando la fuerza cesa, el movimiento también. La verdadera y certera ley newtoniana
tiene un punto de vista diametralmente opuesto. El estado de un cuerpo no afectado por
una fuerza es el de un movimiento uniforme en una línea recta, y la causa de este
movimiento no se debe a ninguna fuerza o influencia externa o, si se prefiere poner así,
a ningún acompañante invariable. El reposo es simplemente un caso particular de este
movimiento, cuando la velocidad es y se mantiene cero. De esta forma, cuando un
cuerpo se está moviendo, no debemos buscar ninguna fuerza externa, excepto para
explicar cambios en la velocidad o en la dirección. Siempre y cuando el cuerpo se
mueva a la misma velocidad y en la misma dirección, no es necesario recurrir a la ayuda
de ningún tipo de fuerza.
La diferencia entre los dos puntos de vista se aprecia mejor si hacemos
referencia a la teoría del movimiento de los planetas. COPÉRNICO (1473-1543)
demostró que era mucho más simple
25
Fig. 4
concebir a los planetas, incluida la Tierra, girando alrededor del sol en órbitas que son
casi circulares; tiempo después KEPLER, en el año 1609, demostró que, de hecho, las
órbitas son prácticamente elipses, esto es, un tipo especial de curvas ovaladas que
consideraremos más tarde con más detalle. Inmediatamente surgió la cuestión de saber
cuáles eran las fuerzas que preservaban a los planetas en este movimiento. De acuerdo
con la vieja y falsa idea, sostenida por KEPLER, la velocidad real en sí misma requería
de la fuerza para su preservación. Entonces buscó la existencia de fuerzas tangenciales,
como demuestra la figura 4. Pero de acuerdo con la ley newtoniana, si no hubiera fuerza
alguna, el planeta se movería por siempre, con su velocidad existente, en una línea recta,
apartándose así del sol. NEWTON, por lo tanto, tuvo que buscar una fuerza que hiciera
que el movimiento
26
Fig. 5
se hiciera curvo y siguiera una órbita elíptica. Demostró que tenía que ser una fuerza
dirigida hacia el sol (figura 5). De hecho, la fuerza es la atracción gravitacional del sol
actuando de acuerdo a la ley del cuadrado inverso de la distancia, como ya vimos más
arriba.
La ciencia de la mecánica surgió entre los griegos a partir de considerar la
ventaja mecánica de usar palancas, y también de tomar en cuenta varios problemas
relacionados con los pesos de los cuerpos. Fue finalmente expuesta de manera
verdadera en los siglos dieciséis y diecisiete, gracias en parte a querer explicar la teoría
de la caída de los cuerpos, pero principalmente gracias a querer desarrollar una teoría
científica del movimiento de los planetas. Pero desde esos días la dinámica se ha
dirigido a tareas más ambiciosas, y parece que, hoy en día, es la ciencia definitiva,
siendo las demás solamente ramas de ésta. La pretensión de ciencia definitiva se refiere
más o menos a esto: las distintas cualidades de las cosas perceptibles a los sentidos son
solamente nuestro peculiar modo de apreciar cambios en la posición de las cosas
existentes en el espacio. Supongamos, por ejemplo, que estamos viendo la Abadía de
Westminster. Ha estado ahí, gris e inamovible, desde hace siglos. Pero, de acuerdo con
la moderna teoría científica, ese gris, que aumenta tanto nuestra sensación de
inmovilidad del edificio, no es otra cosa sino nuestro modo de apreciar los rápidos
movimientos de las moléculas fundamentales, que forman la superficie externa del
27
edificio y otorgan vibraciones a una sustancia llamada éter. Si colocamos nuestras
manos sobre sus piedras notaremos que están frías. Pero esta sensación de temperatura
es simplemente una sensación de la transferencia de calor de la mano a la piedra, o de la
piedra a la mano; y, de acuerdo con la ciencia moderna, el calor no es nada más que la
agitación de las moléculas de un cuerpo. Si escuchamos un órgano, el sonido no es nada
más que el resultado de movimientos del aire que golpean al tímpano del oído.
Así que el esfuerzo para dar una explicación dinámica a los fenómenos consiste
en explicarlos a partir de declaraciones generales, como “tal y tal sustancia o cuerpo
estuvo en este lugar y está ahora en aquel lugar”. Entonces llegamos a la idea
fundamental de la ciencia moderna, a saber, que todas nuestras sensaciones son el
resultado de comparar las cambiantes configuraciones de las cosas en el espacio en
distintos tiempos. Se sigue, por lo tanto, que las leyes del movimiento, esto es, las leyes
de los cambios de las configuraciones de las cosas, son las leyes fundamentales de la
ciencia física.
En la aplicación de las matemáticas a la investigación de la filosofía natural, la
ciencia hace de manera sistemática lo que el pensamiento ordinario hace de manera
casual. Cuando hablamos de una silla, normalmente nos referimos a algo que hemos
visto o sentido en alguna forma; aunque la mayor parte de nuestro lenguaje presupone
que hay algo que existe independientemente de nuestra vista o de nuestra sensación. En
la física matemática, se sigue el rumbo contrario. La silla es concebida sin referencia
alguna a alguien en particular, o a modos especiales de percepción. El resultado de esto
es que la silla se convierte en el pensamiento científico en un conjunto de moléculas en
el espacio, o en un grupo de electrones, o en una porción de éter en movimiento, o
cualquier cosa que la ciencia moderna intente describir. Pero el punto es que la ciencia
reduce la silla a cosas moviéndose en el espacio que influyen en los movimientos de
otras cosas. Entonces los distintos elementos o factores que entran en un conjunto de
circunstancias, así concebidas, son simplemente cosas, tales como longitudes de líneas,
tamaños de ángulos, áreas y volúmenes, por las cuales las posiciones de los cuerpos en
el espacio pueden ser establecidas. Desde luego, adicionalmente a estos elementos
geométricos, las nociones de movimiento y cambio necesitan la introducción de algún
tipo de razón o proporción de cambios en tales elementos, a saber, velocidades,
velocidades angulares, aceleraciones, y cosas por el estilo. De acuerdo con esto, la física
matemática se ocupa de las correlaciones entre los números variables que están
supuestos para representar las correlaciones que existen en la naturaleza entre las
28
medidas de estos elementos geométricos y su proporción o razón de cambio. Pero las
leyes matemáticas siempre se tratan con variables, y es solamente en pruebas
ocasionales de las leyes en experimentos, o en el uso de las leyes para predicciones
específicas, que los números definidos son sustituidos.
El punto interesante sobre el mundo concebido de esta manera abstracta a lo
largo del estudio de la física matemática, donde solamente las posiciones y formas de
las cosas con consideradas conjuntamente con sus cambios, es que los eventos de tal
mundo abstracto son suficientes para “explicar” nuestras sensaciones. Cuando
escuchamos un sonido, las moléculas del aire han sido agitadas de cierta forma: dada la
agitación - u ondas de aire, como son llamadas - cualquier persona normal escucha un
sonido; y si no hay ondas de aire, no hay sonido. Y, de manera similar, una causa u
origen físico, o un evento paralelo (de acuerdo a cómo las personas prefieran
nombrarlo), subyace en nuestras demás sensaciones. Incluso nuestros pensamientos
parecen corresponder a conformaciones y movimientos del cerebro; si se lesiona al
cerebro, se “lesionan” los pensamientos. Mientras tanto, los eventos de este universo
físico se suceden unos a otros de acuerdo con las leyes matemáticas que ignoran toda
sensación, pensamiento o emoción particular o especial.
Sin duda alguna, este es el aspecto general de la relación del mundo de la física
matemática con nuestras sensaciones, pensamientos y emociones; y este tipo especial de
relación ha suscitado una gran controversia. Necesitamos solamente hacer una
observación. Toda la situación ha surgido, como hemos visto, del empeño por describir
un mundo externo que sea capaz de explicar nuestras diferentes sensaciones y
emociones individuales; pero un mundo no esencialmente dependiente de cualesquiera
sensaciones o individuos particulares. ¿Es tal mundo solamente un gran cuento de
hadas? Los cuentos de hadas son fantásticos y arbitrarios: si realmente existiera un
mundo capaz de ser explicado así, tendría que ser uno en donde éste tendría que
someterse a descripciones exactas, que determinen de forma precisa a sus partes y su
relación mutua. Ahora bien, en mayor medida, este mundo científico sí se somete a esta
prueba y permite que sus eventos sean explorados y previstos por el aparato de las ideas
matemáticas abstractas. Parece ser que tenemos aquí una verificación inductiva de
nuestra presunción inicial. Debe ser admitido que ninguna prueba inductiva es
concluyente, pero si toda nuestra idea sobre un mundo que tiene una existencia
independiente de nuestras percepciones particulares fuera errónea, tendría entonces que
29
explicarse por qué el intento de caracterizarlo - en términos de aquel residuo
matemático de nuestras ideas que se aplican a él - produce un éxito tan notable.
Nos llevaría mucho tiempo y esfuerzo el explicar a detalle las otras leyes del
movimiento. Lo que resta de este capítulo será dedicado a dos valiosas ideas que son
fundamentales, tanto para la física matemática como para las matemáticas puras: son las
ideas de las cantidades vectoriales y de la ley del paralelogramo para la suma de
vectores. Hemos visto que la esencia del movimiento es que un cuerpo que estaba en A
está ahora en C. Esta transferencia de A a C requiere de dos elementos distintos para ser
establecida antes de ser completamente determinada, a saber, su magnitud (por ejemplo,
la longitud AC) y su dirección. Ahora cualquier cosa, como esta transferencia, que esté
completamente dada por la determinación de una
Fig. 6
magnitud y una dirección será llamada vector. Por ejemplo, para poder definir una
velocidad, necesitamos asignarle una magnitud y una dirección. Debe ser de tantas
millas por hora en tal y tal dirección. La existencia e independencia de estos dos
elementos en la determinación de una velocidad son bien ejemplificadas si pensamos en
la tarea del capitán de un barco, que comunica a subordinados con diferentes tareas las
acciones a seguir respecto a estos dos elementos: ordena al ingeniero principal en
número de nudos a los que se debe navegar, y al timonel el camino que debe de seguir.
De nuevo el cambio en la velocidad, que es velocidad añadida por unidad de tiempo, es
30
también una cantidad vectorial, y es llamada aceleración. Similar a una fuerza en el
sentido dinámico es otra cantidad vectorial. En realidad, la naturaleza vectorial de las
fuerzas sigue a la vez a los principios dinámicos de la velocidad y la aceleración; pero
este es un punto en el que no entraremos. Es suficiente con decir que una fuerza actúa
sobre un cuerpo con una cierta magnitud en una cierta dirección.
Todos los vectores pueden ser representados gráficamente por medio de líneas
rectas. Todo lo que se tiene que hacer es lo siguiente: (i) una escala según la cual las
unidades de longitud correspondan a unidades de magnitud del vector (por ejemplo, una
pulgada a una velocidad de 10 millas por hora en el caso de velocidades, y una pulgada
a una fuerza de 10 toneladas de peso en el caso de las fuerzas) y (ii) una dirección de la
línea en el diagrama correspondiente a la dirección del vector. Entonces, una línea
trazada con los números correctos de pulgadas de longitud en la dirección correcta
representa el vector requerido en la escala arbitrariamente asignada para la magnitud.
Esta representación esquemática de los vectores es de primera importancia. Gracias a
ella podemos enunciar la famosa “ley del paralelogramo” para la suma de vectores del
mismo tipo pero en distintas direcciones.
Consideremos el vector AC en la figura 6 como representativo del cambio de
posición de un cuerpo de A a C: lo llamaremos el vector de transportación. Debe notarse
que, si la reducción de los fenómenos físicos a simples cambios en posiciones, como ya
fue explicado arriba, es correcta, todos los demás tipos de vectores físicos son
reducibles, de alguna u otra manera, a este único tipo. La transportación final de A a C
es igualmente bien lograda por una transportación de A a B y una transportación de B a
C o, completando el paralelogramo ABCD, por una transportación de A a D y una
transportación de D a C. Estas transportaciones que son así aplicadas de manera
sucesiva se dice que son sumadas conjuntamente. Esta es simplemente una definición de
lo que entendemos por la suma de transportaciones. Nótese también que, si
consideramos las líneas paralelas como líneas trazadas en la misma dirección, las
transportaciones B a C y A a D pueden ser concebidas como la misma transportación
aplicada a cuerpos en las dos posiciones iniciales B y A. Con esta concepción podemos
pensar en la transportación A a D como aplicada a un cuerpo en cualquier posición, por
ejemplo en B. Entonces podemos decir que la transportación A a C puede ser concebida
como la suma de las los transportaciones A a B y A a D aplicadas en cualquier orden.
Tenemos entonces la ley del paralelogramo para la suma de transportaciones: si las
31
transportaciones son A a B y A a D, complétese el paralelogramo ABCD, y entonces la
suma de las dos es la diagonal AC.
Todo esto puede parecer a primera vista muy artificial. Pero debe tenerse en
cuenta que la misma naturaleza nos presenta la idea. Por ejemplo, un buque de vapor se
mueve en la dirección AD (Cf. fig. 6) y un hombre camina a través de su cubierta. Si el
buque de vapor estuviese quieto, en un minuto el hombre llegaría al punto B; pero
durante ese minuto su punto de partida A se ha movido a D, y su camino en la cubierta
se ha movido de AB a DC. Así que, en realidad, su transportación ha sido desde A hasta
C sobre la superficie del mar. Se ha presentado a nuestro análisis, sin embargo, como la
suma de dos transportaciones: una de A a B, relativa al buque de vapor, y otra de A a D,
que es la transportación del buque de vapor.
Si tomamos en cuenta el elemento del tiempo, digamos un minuto, este diagrama
de la transportación del hombre AC representa su velocidad. Porque si AC representaba
tantos pies de transportación, ahora representa una transportación de tantos pies por
minuto o, lo que es lo mismo, representa la velocidad del hombre. Entonces AB y AD
representan dos velocidades, a saber, la velocidad del hombre relativa al buque de
vapor, y la velocidad del buque de vapor, cuya “suma” es la velocidad total del hombre.
Es evidente que los diagramas y las definiciones concernientes a las transportaciones
son convertidos en diagramas y definiciones concernientes a las velocidades al concebir
a los diagramas como representando transportaciones por unidad de tiempo. De nuevo,
los diagramas y las definiciones concernientes a las velocidades son convertidas en
32
Fig. 7
diagramas y definiciones concernientes a la aceleración al concebir a los diagramas
como representando velocidades añadidas por unidad de tiempo.
Entonces, por la suma o adición de velocidades de vectores y de aceleraciones
de vectores, entendemos la suma o adición de acuerdo con la ley del paralelogramo.
También, de acuerdo con las leyes del movimiento, una fuerza está representada
por la aceleración vectorial que produce en un cuerpo de alguna masa dada. De acuerdo
con esto, se dice que las fuerzas son sumadas cuando su efecto conjunto es pensado de
acuerdo con la ley del paralelogramo.
Por consiguiente, para los vectores fundamentales de la ciencia, sean
transportaciones, velocidades, o fuerzas, la suma de cualesquiera dos tipos de vectores
del mismo tipo es la producción de un vector “resultante” de acuerdo con la ley del
paralelogramo.
El tipo más simple de paralelogramo es un rectángulo, y en las matemáticas
puras, es la relación entre el simple vector AC con los dos vectores componentes, AB y
AD, en ángulos rectos (Cf. fig. 7), lo que es continuamente recurrente. Aquí, las
unidades x, y, r representan las longitudes de AB, AD y AC, y las unidades de ángulo m
representan la magnitud del ángulo BAC. Entonces las relaciones entre x, y, r, m, en
todos sus muchos aspectos, son el tema continuamente recurrente de las matemáticas
puras; y los resultados son del tipo requerido para la aplicación de los vectores
33
fundamentales a la física matemática. Este diagrama es el puente principal sobre el cual
los resultados de las matemáticas puras se usan con el fin de obtener aplicaciones a los
hechos de la naturaleza.
34
CAPÍTULO V
EL SIMBOLISMO DE LAS MATEMÁTICAS
Regresemos ahora a las matemáticas puras, y consideremos de manera más
cercana el aparato de ideas sobre el cual esta ciencia está construida. Nuestro primer
contenido tiene que ver con el simbolismo de esta ciencia, y empezaremos con los
símbolos conocidos más simples y universales, a saber, los de la aritmética.
Asumamos que tenemos ideas lo suficientemente claras sobre los números
enteros, representados en la notación arábiga por 0, 1, 2,…, 9, 10, 11,…, 100,101,
etcétera. Esta notación fue introducida en Europa a través de los árabes, pero, a su vez,
parece ser que éstos la obtuvieron de fuentes hindúes. El primer trabajo conocido*en el
que esto está sistemáticamente explicado es un trabajo del matemático hindú
BHASKARA (nacido en 1114 d. C.). Pero los números reales se encontraban ya en el
siglo séptimo de nuestra era, y fueron probablemente inventados en el Tíbet. Para
nuestros propósitos presentes, no obstante, la historia de la notación es solamente un
referente. El punto interesante a notar es la admirable ilustración que este sistema
numeral ofrece para conseguir una buena notación. Al alejar al cerebro de todo trabajo
innecesario, una buena notación permite concentrarse en problemas más avanzados.
Antes de la introducción de la notación arábiga, la multiplicación era mucho más difícil
y la división, incluso de números enteros, planteaba serias dificultades matemáticas.
Probablemente nada hubiera asombrado más a un griego que saber que, gracias a la
educación universal, toda la población de Europa occidental, sin importar clases
sociales, puede realizar operaciones divisionales con números grandes. Este hecho le
hubiera parecido simplemente imposible. La consecuente extensión de la notación a
fracciones decimales se hizo hasta el siglo diecisiete. Nuestra capacidad moderna para
calcular de una manera sencilla con fracciones decimales se debe en buena parte al
descubrimiento gradual de esta notación.
Las matemáticas son a menudo consideradas una ciencia difícil y misteriosa, en
parte también debido a los numerosos símbolos que emplea. Nada resulta más
incomprensible que una serie de símbolos que no entendemos. Pero también resulta
* Para los hechos históricos detallados relacionados a las matemáticas puras, estoy en deuda con el libro A Short History of Mathematics, de W. W. R. Ball.
35
sumamente difícil de entender un simbolismo que solamente entendemos parcialmente
y al que no estamos acostumbrados. Sucede exactamente lo mismo con los términos
técnicos de cualquier profesión: son incomprensibles a aquellos que no están habituados
a usarlos y manipularlos. Pero esto no se debe a que ellos sean difíciles en sí mismos.
Por el contrario, fueron introducidos para facilitar las cosas. Así que en las matemáticas,
el simbolismo representa invariablemente simplificación, y no solamente para un nivel
práctico: representa también un análisis de las ideas del tema y una representación casi
pictórica de las relaciones entre éstas. Si alguien duda de la utilidad de los símbolos,
habría que dejar que escriba de forma completa, sin utilizar ningún símbolo, el
significado de las siguientes ecuaciones que representan algunas de las leyes
fundamentales del álgebra:
x+y=y+x (1)
(x+y)+z=x+(y+z) (2)
x×y=y×x (3)
(x×y)×z=x× (y×z) (4)
x× (y+z)=(x×y)+(x×z) (5)
Aquí, (1) y (2) son llamadas leyes conmutativas y asociativas para la adición, (3) y (4)
son las leyes conmutativas y asociativas para la multiplicación, y (5) es la ley
distributiva de la adición y la multiplicación. Por ejemplo, sin el uso de símbolos, (1)
sería: si un segundo número es añadido a cualquier número dado el resultado es el
mismo a si el primer número dado es añadido al segundo número.
Este ejemplo demuestra que, gracias a los símbolos, podemos hacer operaciones
casi de manera mecánica y visual, y que de otra forma implicarían el uso continuo de las
más altas facultades cerebrales.
Es un principio totalmente erróneo y, desafortunadamente repetido en libros y
por personas, el suponer que se debe cultivar el hábito de pensar lo que hacemos. Se
debe hacer precisamente lo contrario. Una civilización avanza al extender el número de
operaciones importantes que se pueden realizar sin tener que pensar en ellas. Las
operaciones del pensamiento son como los batallones de caballería en una batalla: son
estrictamente limitados en número, requieren de caballos hábiles, y debe ser usada
solamente en momentos decisivos.
36
Una propiedad muy importante que el simbolismo debe poseer es que debe ser
conciso, para poder ser rápidamente escrito y reconocible a la vista. La mejor manera de
lograr consistencia simbólica es poniendo los símbolos en una yuxtaposición inmediata.
Un simbolismo efectivo implica, por lo tanto, que la yuxtaposición de los símbolos
importantes tenga un significado importante. Este es uno de los méritos de la notación
arábiga para los números: por medio de diez símbolos, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, y por
simple yuxtaposición es capaz de simbolizar cualquier número. En álgebra, cuando
tenemos dos números variables x e y, debemos escoger qué debe ser denotado por su
yuxtaposición xy. Las dos ideas más importantes a la mano son las de la suma y la
multiplicación. Los matemáticos han decidido hacer su simbolismo más conciso al
definir xy como x×y. De esta forma, las leyes generales (3), (4) y (5) de arriba pueden
ser escritas como:
xy=yx, (xy)z=x(yz), x(y+z)=xy+xz,
logrando un significativo avance en cuanto a consistencia se refiere.
La misma regla de simbolismo se aplica a la yuxtaposición de un número definido y una
variable: escribimos 3x para 3×x, y 30x para 30×x.
Es evidente que al restaurar la “× ” tenemos que tener cuidado al sustituir
números definidos por variables, de tal manera que no tengamos conflicto con la
notación arábiga. Así, cuando sustituimos 2 por x y 3 por y en xy, debemos escribir 2×3
para xy, y no 23, que significa 20+3.
Es interesante observar cuán importante resulta un símbolo de apariencia
modesta para el desarrollo de la ciencia. Puede estar representando la presentación
enfática de una idea, a menudo una idea muy sutil, y gracias a su existencia hacer
mucho más fácil exhibir la relación de esta idea con todo el complejo entramado de
ideas en la que ocurre. Por ejemplo, tomemos el más modesto de todos lo símbolos, a
saber, 0, que representa al número cero. La notación romana para los números no tenía
un símbolo para el cero, y probablemente la mayoría de los matemáticos del mundo
antiguo hubieran estado perplejos ante la idea del número cero. Porque, después de
todo, es una idea muy sutil y nada obvia. Una gran cantidad de discusiones sobre el
significado del cero referido a cantidad puede ser encontrada en tratados filosóficos. El
cero no es, en realidad, una idea más difícil o sutil que la de cualquier número cardinal.
¿Qué queremos decir por 1, o por 2, o por 3? Lo que sucede es que estamos
37
familiarizados con el uso de estas ideas, aunque nos costaría mucho trabajo hacer un
análisis claro de las ideas y principios más simples que forman estas notaciones. La
cuestión sobre el cero es que no necesitamos usarlo para las operaciones de la vida
diaria. Nadie compra en un mercado cero pescados. Es, en un sentido, el más civilizado
de los números cardinales, y su uso se da en nosotros por la necesidad de cultivar modos
de pensamiento. Se consiguen logros muy importantes gracias al símbolo 0, que
representa al número cero.
El símbolo se desarrolló en conexión con la notación arábiga para los números,
de la cual es una parte esencial. Porque en esa notación el valor de un dígito depende de
la posición en la que se encuentre. Consideremos, por ejemplo, el número 5, como caso
en los números 25, 51, 3512, 5213. En el primer número 5 representa cinco, en el
segundo número 5 representa cincuenta, en el tercer número quinientos, y en el cuarto
número cinco mil. Ahora bien, cuando escribimos el número cincuenta y uno en la
forma simbólica 51, el dígito 1 “empuja” al dígito 5 al segundo puesto (de derecha a
izquierda) y así le da el valor de cincuenta. Pero cuando queremos simbolizar cincuenta
por sí mismo, no podemos hacer que el dígito 1 logre esto; queremos un dígito que
pueda ser puesto sin añadir nada al total pero que “empuje” a 5 al segundo lugar. Esto lo
consigue el 0, símbolo de cero. Es altamente probable que los primeros hombres que
introdujeron el 0 para este propósito no hayan tenido una concepción definida sobre el
número cero. Ellos simplemente querían una marca que simbolizara que nada ha sido
añadido por el dígito que toma un determinado lugar. La idea del cero tomó forma de
manera gradual por el deseo de asimilar el significado de esta marca con el de las
marcas 1, 2,…9, que representan números cardinales. Este no es el único caso en donde
una idea sutil ha sido introducida en las matemáticas por un simbolismo que en sus
orígenes fue ideado por conveniencia práctica.
Entonces está claro que el primer uso del 0 fue para hacer la notación arábiga
posible, sin más. Podemos imaginar que cuando fue introducido para este propósito, los
hombres prácticos, del tipo a los que no gustan de ideas fantasiosas, despreciaron el
absurdo hábito de identificarlo con un número cero. Pero ellos estaban equivocados,
como tales hombres siempre lo están cuando suelen abandonar su propia función de
masticar la comida que otros han preparado. Porque la siguiente función del símbolo 0
depende esencialmente de representar al número cero.
Este segundo uso simbólico es a primera vista tan simple, que resulta difícil
hacer comprender a un principiante su importancia. Empecemos con un ejemplo simple.
38
En el Capítulo II mencionamos la correlación entre dos números variables x e y
representados por la ecuación x+y=1. Esto puede ser representado en un número
indefinido de formas; por ejemplo, 1−= yx , xy −=1 , yxyx 2132 +=−+ , etcétera.
Pero la forma importante de representarlo es
01=−+ yx
De manera similar, la forma importante de escribir la ecuación 1=x es 01=−x , y de
escribir la ecuación 2223 xx =− es 0232 2 =+− xx . El punto es que todos los símbolos
que representan variables, por ejemplo x e y, y los números que representan algún
número definido que no sea cero, tales como 1 ó 2 en los ejemplos anteriores, son
escritos en la parte izquierda, para que toda la parte derecha sea el número cero. Se dice
que el primer hombre que hizo esto fue Thomas HARRIOT, nacido en Oxford en 1560
y muerto en 1621. ¿Pero cuál es la importancia de este simple procedimiento simbólico?
Es que hizo posible el desarrollo de la concepción moderna de forma algebraica.
Esta es una idea a la que tendremos que recurrir continuamente; se podría decir
que ninguna parte de las matemáticas modernas puede ser propiamente entendida sin
una constante recurrencia a este principio. La concepción de forma es tan general que
resulta difícil caracterizarla en términos abstractos. Será mejor que utilicemos ejemplos
para su exposición. Las ecuaciones 032 =−x , 01=−x , 065 =−x , son todas
ecuaciones de la misma forma, a saber, ecuaciones que involucran una incógnita x, que
no es multiplicada por sí misma, de manera que x2, x3, etc., no aparecen. En cambio,
0123 2 =+− xx , 0232 =+= xx , 042 =−x , son todas ecuaciones de la misma forma, a
saber, ecuaciones que involucran una incógnita x en donde x×x, esto es x2, aparece.
Estas ecuaciones son llamadas ecuaciones cuadráticas. De manera similar, las
ecuaciones cúbicas, en donde x3 aparece, producen otra forma, etcétera. De entre las tres
ecuaciones cuadráticas dadas arriba existe una diferencia menor entre la última
ecuación, 042 =−x , y las dos ecuaciones precedentes, debido al hecho de que x (como
distinta de x2) no aparece en la última ecuación y sí en las otras dos. Esta distinción no
tiene importancia alguna en comparación con el hecho de que las tres son ecuaciones
cuadráticas.
Existen también formas de ecuaciones que representan correlaciones entre dos
variables; por ejemplo, 01=−+ yx , 0832 =−+ yx , etcétera. Estos son ejemplos de lo
39
que se llama la forma lineal de ecuación. La razón de este nombre “lineal” es que el
método gráfico de representación, explicado al final del capítulo II, siempre representa
tales ecuaciones por una línea recta. También existen otras formas para dos variables,
por ejemplo, la forma cuadrática, la forma cúbica, etcétera. Pero el punto sobre el que
queremos insistir es que este estudio de forma es facilitado y, en realidad, hecho
posible, gracias al método estándar de escribir ecuaciones con el símbolo 0 en la parte
derecha.
Existe todavía una función más realizada por 0 en relación con el estudio de la
forma. Cualquier número que x sea, 0×x=0, y x+0=x. Las diferencias menores de forma
pueden ser asimiladas por medio de estas propiedades. Así, la diferencia mencionada
arriba entre las ecuaciones cuadráticas 0232 =+= xx , y 042 =−x , puede ser
eliminada al escribir la última ecuación en la forma 04)0(2 =−×+ xx . Porque, debido
a las leyes establecidas arriba, 4404)0( 222 −=−+=−×+ xxxx . Por lo tanto, la
ecuación 042 =−x , es simplemente representativa de una clase particular de
ecuaciones cuadráticas, y pertenece a la misma forma general que 0232 =+− xx .
Por estas tres razones el símbolo 0, representando al número cero, es esencial
para las matemáticas modernas. Ha permitido tipos específicos de investigación que
hubieran sido imposibles sin él.
El simbolismo de las matemáticas es en verdad el resultado de las ideas
generales que dominaron a la ciencia. Tenemos entonces dos ideas generales ante
nosotros, la de la variable y la de la forma algebraica. La unión de estos conceptos ha
impuesto a las matemáticas otro tipo de simbolismo muy extraño en su naturaleza, pero
igualmente efectivo. Hemos visto que una ecuación con dos variables, x e y, representa
una correlación particular entre el par de variables. Así, 01=−+ yx representa una
correlación definida, y 0523 =−+ yx representa otra correlación definida entre las
variables x e y; y ambas correlaciones tienen la forma de lo que hemos llamado
correlaciones lineales. Pero ahora surge la pregunta, ¿cómo podemos representar
cualquier correlación lineal entre los números variables x e y? Lo que queremos hacer
es simbolizar cualquier correlación lineal, así como x simboliza cualquier número. Esto
se logra convirtiendo los números que aparecen en la correlación definida
0523 =−+ yx en letras. Obtenemos 0=−+ cbyax . Aquí, a, b, c representan números
variables tal como lo hacen x e y; pero existe una diferencia en el uso de los dos
conjuntos de variables. Estudiamos las propiedades generales de la relación entre x e y
40
mientras a, b, y c tengan valores sin cambios. No determinamos cuáles son los valores
de a, b, y c; pero cualesquiera que ellos sean, se mantienen fijos mientras estudiamos la
relación entre las variables x e y para todo el grupo de posibles valores de x e y. Pero
cuando hemos obtenido las propiedades de esta correlación, notamos que, debido a que
a, b, y c no han sido de hecho determinadas, hemos probado propiedades que deben
pertenecer a cualquiera tal relación. Así, al modificar la idea sobre a, b, y c, llegamos al
concepto de que 0=−+ cbyax representa una correlación lineal variable entre x e y. En
comparación con x e y, las tres variables a, b, y c son llamadas constantes. Las variables
usadas de este modo también pueden ser llamadas parámetros.
Los matemáticos habitualmente se ahorran el problema de explicar cuáles de sus
variables serán tratadas como “constantes”, y cuáles como variables, consideradas como
correlacionadas en sus ecuaciones, usando las letras del final del alfabeto como
variables “variables”, y las letras al principio del alfabeto como variables “constantes”,
o parámetros. Los dos sistemas se encuentran de manera natural en la mitad del
alfabeto. A veces una explicación es necesaria para evitar confusiones, pero, en
realidad, la costumbre y el sentido común son comúnmente suficientes para evitarlas, y
sorprendentemente éstas no son causadas por un procedimiento que a primera vista
parece tan laxo.
El resultado de esta continua eliminación de números definidos por sucesivas
capas de parámetros es que la cantidad de conocimiento aritmético desarrollado por los
matemáticos es extremadamente pequeña. A muchos matemáticos no les agrada la
computación numérica y no suelen ser expertos en ella. El territorio de la aritmética
termina donde el imperio de las dos ideas de “variables” y “formas algebraicas”
comienza.
41
CAPÍTULO VI
GENERALIZACIONES DE LOS NÚMEROS
Una gran peculiaridad de las matemáticas es el conjunto de ideas relacionadas
que ha sido inventado en conexión con los números enteros. Estas ideas pueden ser
llamadas extensiones o generalizaciones de los números. En primer lugar, está la idea de
las fracciones. El primer tratado sobre aritmética del que tenemos conocimiento fue
escrito por un sacerdote egipcio, llamado AHMES, entre los años 1700 a. C. y 1100 a.
C., y es probablemente una copia de un trabajo mucho más antiguo. Trata, en gran parte,
de las propiedades de las fracciones. Parece ser, por lo tanto, que este concepto fue
desarrollado muy temprano en la historia de las matemáticas. En realidad, el tema es
muy obvio. Dividir un campo en tres partes iguales, y luego tomar dos de las partes,
debió haber sido un tipo de operación muy común y recurrente. De acuerdo con esto, no
debe sorprendernos el que los hombres de civilizaciones remotas estuvieran
familiarizados con la idea de dos tercios y de nociones parecidas. Entonces
consideraremos al concepto de fracciones como la primera generalización del número.
Los griegos pensaron en este tema más bien en la forma de proporciones, de manera que
un griego diría de manera natural que una línea de dos pies de longitud tiene, a una línea
de tres pies de longitud, la proporción de 2 a 3. Bajo la influencia de nuestra notación
algebraica, diríamos más bien que una línea es dos tercios de la otra en longitud, y
pensaríamos en dos tercios como un multiplicador numérico.
En relación con la teoría de la proporción, o de las fracciones, los griegos
hicieron un gran descubrimiento, que ha dado lugar a una gran cantidad de pensamiento,
tanto filosófico como matemático. Encontraron la existencia de proporciones
“inconmensurables”. Lograron probar, de hecho, a partir de sus investigaciones
geométricas que, comenzando con una línea de cualquier longitud, deben existir otras
líneas cuyas longitudes no llevan a la longitud original la proporción de ningún par de
números enteros o, en otras palabras, que existen líneas que no son ninguna fracción
exacta de la línea original.
Por ejemplo, la diagonal de un cuadrado no puede ser expresada como ninguna
fracción del lado del mismo cuadrado; en nuestra notación moderna la longitud de la
diagonal es 2 veces la longitud del lado. Pero no hay ninguna fracción que represente
42
de manera exacta a 2 . Nos podemos aproximar a 2 tanto como queramos, pero
nunca alcanzaremos su valor exacto. Por ejemplo, 25
49 es un poco menos que 2, y
4
9 es
mayor que 2, de manera que 2 se encuentra entre 5
7 y
2
3. Pero la mejor forma
sistemática de aproximarse a 2 al obtener una serie de fracciones decimales, cada una
mayor que la última, es por el método ordinario de extraer la raíz cuadrada, así, la serie
es 1, 10
14,
100
141,
1000
1414, etcétera.
Las proporciones de este tipo fueron llamadas por los griegos inconmensurables.
Han dado lugar a una gran cantidad de discusiones filosóficas, y las dificultades
relacionadas con ellas sólo han sido aclaradas recientemente.
Pondremos a las proporciones inconmensurables con las fracciones, y
consideraremos todo el conjunto de números enteros, números fraccionales, y números
inconmensurables como integrantes de una clase de números que llamaremos “números
reales”. Siempre pensamos en los números reales como ordenados o arreglados en
cuanto a su magnitud, empezando desde cero y yendo hacia arriba, y convirtiéndose
indefinidamente en más grandes y en más grandes a medida que avanzamos. Los
números reales son convenientemente representados por puntos en una línea.
0 2
1 1
2
3 2
2
5 3
2
7 4
0 M A N B P C Q D X
Sea 0X cualquier línea limitada a 0 y extendiéndose indefinidamente en la dirección 0X.
Tomemos cualquier punto conveniente, A, en ella, de tal forma que 0A represente la
unidad de longitud; y dividamos longitudes AB, BC, CD, etc., cada una igual a 0A. El
punto 0 representa el número 0, A el número 1, B el número 2, etc. De hecho, el número
representado por cualquier punto es la medida de su distancia desde 0, en términos de la
unidad de longitud 0A. Los puntos entre 0 y A representan las fracciones propias y los
números inconmensurables menores a 1; el punto medio de 0A representa 2
1, el de AB
43
representa 2
3, el de BC representa
2
5, etc. De esta forma, cada punto en 0X representa
algún número real, y cada número real es representado por algún punto en 0X.
La serie (o fila) de puntos a lo largo de 0X, empezando desde 0 y moviéndose de
manera regular en la dirección de 0 a X, representa a los números reales como
ordenados o arreglados en un orden de tamaño ascendente, empezando desde cero e
incrementándose continuamente.
Todo esto parece demasiado simple, pero hay algunas ideas interesantes que
debemos tomar en cuenta al tratar estos hechos tan obvios. Consideremos la serie de
puntos que representan los números enteros solamente, a saber, los puntos 0, A, B, C,
D, etc. Aquí hay un primer punto 0, un siguiente punto definido A, y cada punto, sea A
o B, tiene inmediatamente un predecesor definido y un sucesor definido, con la
excepción de 0, que no tiene predecesor; también hay que observar que la serie sigue de
manera indefinida y sin fin. Este tipo de orden es llamado el tipo de orden de los
enteros; su esencia es la posesión de “vecinos de al lado” en uno y otro lado con la
excepción del número 1 en la fila. Consideremos de nuevo a los enteros y a las
fracciones de manera conjunta, omitiendo las cuestiones que corresponden a las
proporciones inconmensurables. El tipo de orden serial que obtenemos ahora es
sumamente distinto. Hay un primer término 0; pero ningún término tiene algún
predecesor o sucesor inmediato. Esto se puede ver fácilmente, si pensamos en que, entre
cualesquiera dos fracciones, siempre podemos encontrar otra fracción intermedia en
valor. Un modo muy simple de hacer esto es sumando las fracciones y dividiendo el
resultado. Por ejemplo, entre 3
2 y
4
3, se encuentra la fracción
2
1
+4
3
3
2, esto es
24
17;
y entre 3
2 y
24
17 se encuentra la fracción
2
1
+24
17
3
2, esto es
48
33, etc., de manera
indefinida. Debido a esta propiedad, se dice que la serie es “compacta”. No existe un
punto final en la serie, que se incrementa de manera indefinida sin ningún límite a lo
largo de la línea 0X. Parecería a primera vista como si el tipo de serie obtenida de este
modo desde las fracciones, incluyendo siempre a los números enteros, pudiera ser la
misma como si fuese obtenida desde todos los números reales, enteros, fracciones e
inconmensurables en su conjunto, esto es, desde todos los puntos en la línea 0X. Todo
lo que hemos dicho hasta ahora sobre la serie de las fracciones se aplica igualmente a la
44
serie de todos los números reales. Pero existen diferencias importantes que ahora
consideraremos.
La ausencia de inconmensurables en la serie de las fracciones deja una ausencia
de puntos finales para ciertas clases. Consideremos al inconmensurable 2 . En la serie
de los números reales esto está entre todos los números cuyos cuadrados sean menores
que 2, y entre todos los números cuyos cuadrados sean mayores a 2. Pero si pensamos
en la serie de las fracciones sin considerar a los inconmensurables, esto es, sin
considerar a 2 , no hay fracción alguna que tenga la propiedad de dividir la serie en
dos partes de este modo, es decir, que todos los miembros de un lado tengan cuadrados
menores que 2, y en el otro lado mayores que 2. Por lo tanto, en la serie de las
fracciones existe un cuasi-vacío en donde 2 debería estar. Esta presencia de cuasi-
vacíos en la serie de las fracciones podría parecer algo sin importancia; pero cualquier
matemático que leyera esto, sabe que la posible ausencia de límites o de máximos en
una clase de números, que aún no se ha propagado sobre toda la serie de los números,
no es un tema sin importancia. Para evitar esta dificultad y que no haya vacíos, se
recurre a los inconmensurables.
Existe otra diferencia incluso más fundamental entre las dos series. Podemos
reordenar las fracciones en una serie como la de los enteros, esto es, con un primer
término, y que cada término tenga un sucesor inmediato (excepto el primer término) y
un predecesor inmediato. Veamos cómo se puede hacer. Cada término en la serie de
fracciones y enteros es escrito en forma fraccional, esto es, 1
1 para 1,
1
2para 2, y así
para todos los enteros, con excepción del 0. Además, por el momento, consideraremos
fracciones que son iguales en valor, pero no reducidas a sus términos más bajos, como
distintas; para que, por ejemplo, hasta nuevo aviso, 3
2,
6
4,
9
6,
12
8, etc., sean
reconocidas como distintas. Ahora agrupamos las fracciones en clases al sumar
conjuntamente el numerador y el denominador de cada término. Por el bien de la
brevedad, llamemos a esta suma del numerador y del denominador de una fracción su
índice. Así, 7 es el índice de 3
4, y también de
4
3 y de
5
2. Las fracciones en cada clase
serán fracciones que tienen algún índice específico, y que llamaremos la clase del
índice. Ahora arreglamos estas clases en el orden de magnitud de sus índices. La
45
primera clase tiene el índice 2, y su único miembro es 1
1; la segunda clase tiene el índice
3, y sus miembros son 2
1 y
1
2; la tercera clase tiene el índice 4, y sus miembros son
3
1,
2
2,
1
3; la cuarta clase tiene el índice 5, y sus miembros son
4
1,
3
2,
2
3,
1
4; etc. Es fácil
observar que el número de miembros (todavía incluyendo fracciones no consideradas en
sus términos más bajos) pertenecientes a cualquier clase es uno menos que su índice.
Además, los miembros de cualquier clase pueden ser ordenados en orden al tomar al
primer miembro para que sea la fracción con numerador 1, el segundo miembro que
tenga el numerador 2, etc., hasta )1( −n donde n es el índice. Así, para la clase de índice
n, los miembros aparecen en el orden:
1
1
−n,
2
2
−n,
3
3
−n,…,
1
1−n. Los miembros de las primeras cuatro clases han sido, de
hecho, mencionados en este orden. De esta forma, todo el conjunto de fracciones ha
sido arreglado en un orden como el de los enteros:
1
1,
2
1,
1
2,
3
1,
2
2,
1
3,
4
1,
3
2,2
3,
1
4,…,
1
2−n,
1
1
−n,
2
2
−n,
3
3
−n,…,
1
1−n,
n
1, etc.
Ahora podemos deshacernos de todas las repeticiones de fracciones del mismo
valor simplemente sacándolas de la serie cada vez que surjan después de su primera
aparición. En los pocos términos iniciales escritos arriba, 2
2, que está encerrada en
corchetes, es la única fracción que no está en sus términos más bajos. Además, ya había
aparecido antes como 1
1, por lo tanto, debe ser sacada de la serie. Pero la serie todavía
conserva las mismas propiedades, a saber, (a) hay un primer término, (b) cada término
tiene vecinos de al lado, (c) la serie sigue sin fin.
Puede ser probado que no es posible arreglar toda la serie de números reales bajo
esta forma. Este hecho fue descubierto por Georg CANTOR, un eminente matemático
46
alemán; y esto es de mayor importancia para la filosofía de las ideas matemáticas.
Estamos de hecho tocando la franja de los grandes problemas del significado de la
continuidad y del infinito.
Otra extensión del número proviene de la introducción de la idea de lo que ha
sido llamado una operación o un paso, nombres que son respectivamente apropiados
desde puntos de vista ligeramente distintos. Empezaremos con un caso en particular.
Consideremos la declaración 2+3=5. Añadimos 3 a 2 y obtenemos 5. Pensemos en la
operación de sumar 3: denotemos esto como +3. De nuevo, 134 =− . Pensemos en la
operación de restar 3: denotemos esto como 3− . De esta forma, en lugar de considerar
a los números reales en sí mismos, consideraremos las operaciones de sumarlos o
restarlos: en lugar de 2 , consideraremos +2 y 2− , a saber, las operaciones de
sumar 2 y de restar 2 . Entonces, podemos sumar estas operaciones, por supuesto
en un sentido distinto de sumar a aquel en el que sumamos números. La suma de dos
operaciones es la simple operación que tiene el mismo efecto al de si las dos
operaciones fueran aplicadas sucesivamente. ¿En qué orden deben ser aplicadas las dos
operaciones? La respuesta es que es indiferente, porque, por ejemplo,
2+3+1=2+1+3;
de modo que la suma de los pasos +3 y +1 es conmutativa.
Los matemáticos tienen el hábito, que suele ser desconcertante para aquellos
interesados en rastrear los significados, pero que es muy conveniente en la práctica, de
usar el mismo símbolo en sentidos diferentes aunque relacionados. El único requisito
esencial para un símbolo es que, cualquiera que sea su posible variedad de significado,
las leyes formales de su uso sean siempre las mismas. En concordancia con este hábito,
la suma de operaciones es denotada por +, así como lo es la suma de los números.
Entonces podemos escribir
(+3)+(+1)=+4;
donde el + de la mitad en la parte izquierda denota la adición de las operaciones +3 y
+1. Pero no necesitamos ser tan pedantes en nuestro simbolismo, excepto en casos raros
en donde tengamos que rastrear el significado; de manera que siempre sacamos el
47
primer + y los paréntesis de una línea, y nunca escribimos dos + seguidos. Así que la
ecuación de arriba se convierte en:
3+1=4
que interpretamos como simple adición o suma numérica, o como la más elaborada
adición o suma de operaciones que está expresada en la forma previa de escribir la
ecuación, o, por último, como expresión del resultado de aplicar la operación +1 al
número 3 y obtener el número 4. Cualquiera de estas interpretaciones es correcta. Pero
la única interpretación que es siempre posible, bajo ciertas condiciones, es aquella de las
operaciones. Las otras interpretaciones producen, a menudo, resultados sin sentido.
Esto nos conduce a una pregunta, que seguramente surgió en la mente del lector:
¿Cuál es el uso de toda esta elaboración? En este punto nuestro amigo, el hombre
práctico, seguramente insistiría en barrer todas estas telarañas del cerebro. La respuesta
es que lo que está buscando el matemático es generalidad. Esta es una idea digna de ser
puesta al lado de la variable y la forma, porque concierne a una parte fundamental del
procedimiento matemático. Cualquier limitación a la generalidad de los teoremas, de las
pruebas o de la interpretación, resulta odiosa al instinto matemático. Estas tres nociones,
la variable, la forma, y la generalidad, componen una especie de trinidad matemática
que preside a todos los temas relacionados con la materia. Todas ellas surgen de la
misma raíz, a saber, la naturaleza abstracta de la ciencia matemática.
Veamos cómo se logra la generalidad por la introducción de esta idea de las
operaciones. Tomemos la ecuación x+1=3; la solución es x=2. Aquí podemos
interpretar nuestros símbolos como simples números, y el recurso a las “operaciones” es
completamente innecesario. Pero, si x es un simple número, la ecuación x+3=1 no tiene
sentido. Porque x debe ser el número de cosas que permanecen cuando hemos quitado 3
cosas de 1 cosa; y tal procedimiento no es posible. En este momento, nuestra idea de
forma algebraica aparece, formando la generalización bajo otro aspecto. Consideremos,
por lo tanto, la ecuación general de la misma forma que x+1=3. Esta ecuación es x+a=b,
y su solución es abx −= . Aquí nuestras dificultades se agravan; porque esta forma
solamente puede ser usada para la interpretación numérica siempre y cuando b sea
mayor que a, y no podemos decir, sin alguna evaluación, que a y b puedan ser
cualesquiera constantes. En otras palabras, hemos introducido una limitación en la
variabilidad de las “constantes” a y b, que tendremos que arrastrar, como una cadena, a
48
lo largo de todo nuestro razonamiento. Bajo tales condiciones, las investigaciones
matemáticas realmente prolongadas serían imposibles. Cada ecuación estaría enterrada
bajo un montón de limitaciones. Pero si ahora interpretamos nuestros símbolos como
“operaciones”, toda limitación desaparece como por arte de magia. La ecuación x+1=3
da x=+2, la ecuación x+3=1 da 2−=x , la ecuación x+a=b da abx −= , que es una
operación de suma o resta según sea el caso. No necesitamos nunca decidir si ab−
representa la operación de suma o de resta, porque las reglas de procedimiento con los
símbolos son las mismas en cualquier caso.
El objetivo de este trabajo no es escribir un capítulo detallado de álgebra
elemental, sino simplemente el de hacer claras las ideas fundamentales que guían la
formación de la ciencia. De acuerdo con esto, no iremos más allá para explicar las
sutiles reglas por las cuales los “números positivos y negativos” son multiplicados y de
otra manera combinados. Hemos explicado arriba que los números positivos y negativos
son operaciones. También se les ha llamado “pasos”. Así, +3 es el paso por el cual
vamos de 2 a 5, y 3− es el paso hacia atrás por el cual vamos de 5 a 2. Consideremos la
línea 0X dividida bajo la forma explicada en la primera parte del capítulo, de tal manera
que sus puntos representen números.
D’ C’ B’ A’ +1 +2 +3
X’ X
-3 -2 -1 0 A B C D E
Entonces, +2 es el paso de 0 a B, o de A a C, o (si las divisiones son tomadas hacia atrás
a lo largo de 0X’) de C’ a A’, o de D’ a B’, etc. De manera similar, 2− es el paso de 0 a
B’ o de B’ a D’, o de B a 0, o de C a A.
Podemos considerar el punto que es alcanzado por un paso desde 0, como
representativo de ese paso. Así, A representa +1, B representa +2, A’ representa 1− , B’
representa 2− , etc. Debe ser notado que, mientras que previamente con los números
reales “no asignados”, los puntos de un lado de 0 eran (a lo largo de 0X) solamente
representativos de números, ahora, con los pasos, cada punto en toda la línea que se
extiende a ambos lados de 0 es representativo de un paso. Esta es una representación
pictórica de la generalidad superior introducida por los números positivos y negativos, a
saber, las operaciones o los pasos. Estos números “asignados” son también casos
49
particulares de lo que se ha llamado vectores (del latín veho, “Yo saco” o “Yo llevo”).
Porque podemos pensar en una partícula que es llevada de 0 a A, o de A a B.
Al sugerir en páginas anteriores que el hombre práctico tendría objeciones a las
sutilezas relacionadas con la introducción de los números positivos y negativos,
estábamos difamando a ese excelente individuo. Porque en verdad estamos ante uno de
sus más grandes triunfos. Si la verdad debe ser dicha, fue el hombre práctico el primero
un utilizar los símbolos −+ y . Su origen no es muy claro, pero parece probable que
surgieron de las marcas hechas en los bienes de los almacenes alemanes, para denotar
exceso o defecto de algunos pesos estándar. La primera referencia a ellos está en un
libro publicado en Leipzig en 1489. La primera vez que fueron utilizados en las
matemáticas, fue en un libro publicado en Nuremberg en 1544, obra de un hombre
llamado STIFEL. Pero es solamente en los años recientes cuando a los alemanes se les
ha considerado un pueblo práctico. Existe un viejo epigrama que asigna el imperio del
mar a los ingleses, el de la tierra a los franceses, y el de las nubes a los alemanes.
Seguramente fue en las nubes en donde los alemanes buscaron los símbolos −+ y ; las
ideas que estos símbolos han generado son tan importantes para el bienestar de la
humanidad, que no pudieron haber surgido del mar o de la tierra.
Las posibilidades de aplicación de los números positivos y negativos resultan
muy obvias. Si las longitudes en una dirección son representadas por un número
positivo, las de la dirección opuesta son representadas por números negativos. Si una
velocidad en una dirección es positiva, la de la dirección opuesta es negativa. Si la
rotación alrededor de una esfera en dirección opuesta a las manecillas del reloj es
positiva, aquella siguiendo las manecillas del reloj es negativa. Si un balance en el
banco es positivo, un sobregiro es negativo. Si la electrificación vítrea es positiva, la
electrificación resinosa es negativa. De hecho, en este último caso, los términos
electrificación positiva y electrificación negativa, considerados como simples nombres,
han prácticamente dejado en desuso a los otros términos. Una serie sin fin de ejemplos
podría ser dada. La idea de números positivos y negativos ha sido la más exitosa de las
sutilezas matemáticas.
50
CAPÍTULO VII
NÚMEROS IMAGINARIOS
Si las ideas matemáticas tratadas en el último capítulo han tenido un cierto éxito
en general, las del presente capítulo han logrado despertar una atención e interés muy
parecidos. Pero el éxito de estas últimas ha sido de un tipo distinto, ha sido lo que los
franceses llaman un succès de scandale. No solamente el hombre práctico, sino también
los hombres de letras y los filósofos han expresado su desconcierto ante la devoción de
algunos matemáticos por las misteriosas entidades que, por su nombre, declaran ser
imaginarias. En este punto cabe aclarar que un cierto tipo de intelecto menor está
siempre preocupando a sí mismo y a los demás con discusiones como la aplicabilidad
de términos técnicos. ¿Son los números inconmensurables propiamente llamados
números? ¿Son los números positivos y negativos realmente números? ¿Son los
números imaginarios realmente imaginarios y números?, son algunos ejemplos de estas
preguntas estériles. Ahora bien, es difícil de entender que en la ciencia, los nombres de
los términos técnicos sean asignados de manera arbitraria, como son asignados los
nombres a los niños. Es imposible responder sobre si los nombres son correctos o
incorrectos. Más bien, podrían responder a un juicio o a otro, al ser asignados de tal o
cual manera para ser fácilmente recordados, o para sugerir ideas relevantes o
importantes. Pero el principio esencial involucrado fue claramente enunciado en El País
de las Maravillas a Alicia por Humpty Dumpty cuando le dijo que, a propósito de su uso
de las palabras, “Yo les pago extra y hago que signifiquen lo que yo quiero”. De manera
que no nos preocuparemos en cuanto a si los números imaginarios son imaginarios, o si
son números, sino tomaremos la frase como el nombre arbitrario de cierta idea
matemática, de la que nos ocuparemos ahora.
El origen de la concepción es muy similar a aquella de los números positivos y
negativos: se debe también a las tres grandes ideas matemáticas, a saber, la variable, la
forma algebraica, y la generalización. Los números positivos y negativos surgieron de la
consideración de ecuaciones como x+1=3, x+3=1, y de la forma general x+a=b. De
manera similar, el origen de los números imaginarios se debe a ecuaciones como
x2+1=3, x2+3=1, y x2+a=b. Se sigue exactamente el mismo proceso. La ecuación x2+1=3
se vuelve x2=2, y esto tiene dos soluciones, o x= + 2 , o 2−=x . La declaración que
51
indica que existen estas soluciones alternativas, se escribe usualmente como x= ± 2 .
Hasta ahora todo es fácil, como lo fue en el caso anterior. Pero ahora surge una
dificultad análoga. Porque la ecuación x2+3=1 da x2= 2− , y no existe algún número
positivo o negativo que, cuando sea multiplicado por sí mismo, sea un cuadrado
negativo. Por lo tanto, si nuestros símbolos tienen el sentido de los números positivos y
negativos ordinarios, no existe solución para x2= 2− , y la ecuación no tiene sentido.
Así, si tomamos la forma general x2+a=b, encontramos el par de soluciones
)( abx −±= , si y sólo si b no es menor que a. De acuerdo con esto, no podemos decir
que las “constantes” a y b sean cualesquiera números, esto es, las “constantes” a y b no
son, como deberían ser, “variables” independientes e irrestrictas; y de nuevo surgen los
problemas de las limitaciones y las restricciones.
La misma labor de antes nos espera nuevamente: debemos dar una nueva
interpretación a nuestros símbolos, para que las soluciones ± )( ab− para la ecuación
x2+a=b siempre tengan sentido. En otras palabras, necesitamos una interpretación de los
símbolos para que a siempre tenga sentido si a es positivo o negativo. Desde luego,
la interpretación debe ser tal que todas las leyes ordinarias formales de la adición
(suma), sustracción (resta), multiplicación y división se mantengan; y tampoco debe
interferir con la generalidad hemos alcanzado con el uso de los números positivos y
negativos: de hecho, debe en un sentido incluirlos como casos especiales. Cuando a es
negativa, podemos escribir 2c− por ella, de modo que c2 sea positiva. Entonces
a = )( 2c− = 2)1( c×−
= )1(− 2c = c )1(−
Por lo tanto, si podemos interpretar nuestros símbolos de tal manera que )1(− tenga
un significado, hemos alcanzado nuestro objetivo. Así, )1(− ha venido a ser
considerada como la más importante de todas las cantidades imaginarias.
Esta tarea de encontrar una interpretación para )1(− es mucho más difícil que
la tarea análoga de interpretar 1− . De hecho, mientras que el más fácil de los problemas
era solucionado casi instintivamente tan pronto como aparecía, no ocurrió lo mismo en
un primer momento, ni siquiera para los más grandes matemáticos, con otro tipo de
52
problemas. Ecuaciones como 32 −=x , cuando surgieron, fueron simplemente
consideradas como sinsentido.
Sin embargo, fue siendo percibida gradualmente, a lo largo del siglo dieciocho, e
incluso antes, la conveniencia de que una interpretación pudiera ser asignada a estos
símbolos sinsentido. Se había hecho ya un razonamiento formal de estos símbolos,
simplemente asumiendo que obedecían a las leyes algebraicas ordinarias de
transformación; y se vio que un importante cúmulo de resultados interesantes surgiría si
estos símbolos pudieran ser usados legítimamente. Muchos matemáticos no tenían muy
claro el principio de la lógica de su procedimiento, y ganó terreno la idea de que, de un
modo misterioso, los símbolos que no significaran nada podían ser adecuadamente
manipulados para producir pruebas válidas de proposiciones. Nada puede ser más falso.
Un símbolo que no tiene un significado propiamente definido no es un símbolo. Es
solamente una mancha de tinta con una forma fácilmente reconocible sobre un papel.
No se puede probar nada a partir de la sucesión de manchas de tinta, excepto la
existencia de una pluma defectuosa o de un escritor descuidado. Fue durante esta época
que el epíteto “imaginario” fue aplicado a )1(− . Lo que estos matemáticos habían
conseguido probar fue una serie de proposiciones hipotéticas, de la cual esta es la forma
en blanco: Si las interpretaciones existen para )1(− y para la adición (suma),
sustracción (resta), multiplicación y división de )1(− que satisfacen las reglas
ordinarias del álgebra (por ejemplo, x+y=y+x, etc.), entonces tales y tales resultados se
conseguirán. Fue natural que los matemáticos no siempre apreciaran el gran “Si”, que
debió haber precedido las declaraciones de sus resultados.
Como puede esperarse, la interpretación - cuando fue encontrada - fue un asunto
mucho más elaborado que aquel de los números negativos, y se requiere la atención del
lector para que se pueda dar una explicación preliminar. Ya hemos visto la
representación de un punto por dos números. Con la ayuda de los números positivos y
negativos podemos ahora representar la posición de cualquier punto en un plano por un
par de tales números.
53
Fig. 8
Entonces tomemos el par de líneas rectas X0X’ y Y0Y’, en ángulos rectos, como los
“ejes” desde los cuales empezaremos todas nuestras mediciones. Las longitudes
medidas a lo largo de 0X y 0Y son positivas, y las medidas hechas hacia atrás a lo largo
de 0X’ y 0Y’ son negativas. Supongamos que un par de números escritos en orden (por
ejemplo, +3, +1) - de modo que haya un primer número (+3 en el ejemplo de arriba), y
un segundo número (+1 en el ejemplo de arriba) - representa mediciones desde 0 a lo
largo de X0X’ para el primer número, y a lo largo de Y0Y’ para el segundo número.
Así, (Cf. fig. 9), en (+3, +1) una longitud de 3 unidades debe ser medida a lo largo de
X0X’ en la dirección positiva, esto es, desde 0 hacia X, y una longitud +1 debe ser
medida a lo largo de Y0Y’ en la dirección positiva, esto es, desde 0 hacia Y. De manera
similar, en )1,3( +− la longitud de 3 unidades debe ser medida desde 0 hacia X’, y de 1
unidad desde 0 hacia Y’. También en )1,3( −− las dos longitudes deben ser medidas a lo
largo de 0X’ y 0Y’, respectivamente, y en )1,3( −+ a lo largo de 0X y 0Y’,
respectivamente. Llamemos por el momento a tal par de números una “pareja
ordenada”. Entonces, pueden ser generadas ocho parejas ordenadas de los dos números
1 y 3, a saber
(+1, +3), )3,1( +− , )3,1( −− , )3,1( −+
(+3, +1), )1,3( +− , )1,3( −− , )1,3( −+
54
Cada una de estas ocho “parejas ordenadas” dirige un proceso de medición a lo
largo de X0X’ y Y0Y’ que es diferente de aquel dirigido por cualquier otra de las
parejas.
Los procesos de medición representados por las últimas cuatro parejas
ordenadas, son dados de manera pictórica en la figura. Las longitudes 0M y 0N
corresponden conjuntamente a (+3, +1), las longitudes 0M’ y 0N a )1,3( +− , 0M’ y 0N’
a )1,3( −− y 0M y 0N’ a )1,3( −+ .
Fig. 9
Pero al completar los distintos rectángulos, es fácil observar que el punto P determina
completamente y es a la vez determinado por la pareja ordenada (+3, +1), el punto P’
por )1,3( +− , el punto P’’ por )1,3( −− y el punto P’’’ por )1,3( −+ . De manera más
general, en la figura previa (8) el punto P corresponde a la pareja ordenada (x,y), donde
x e y son ambas asumidas como positivas, el punto P’ corresponde a (x’,y), donde x’ es
asumida como negativa, P’’ a (x’,y’), y P’’’ a (x,y’). Entonces tenemos una pareja
ordenada (x,y), donde x e y son cualesquiera números positivos o negativos, y el punto
correspondiente determina recíprocamente unos a otros. Es conveniente introducir
algunos nombres para esta coyuntura. En la pareja ordenada (x,y) el primer número x es
llamado la “abscisa” del punto correspondiente, y el segundo número y es llamado la
“ordenada” del punto, y los dos números juntos son llamados las “coordenadas” del
55
punto. La idea de determinar la posición de un punto por sus “coordenadas” no fue de
ninguna manera nueva en el momento en que la teoría de los “imaginarios” se estaba
formando. Esta idea se debe a DESCARTES, el gran matemático y filósofo francés, y
aparece en su Discurso, publicado en Leyden en 1637. La idea de la pareja ordenada
considerada en sí misma es el resultado de los esfuerzos para interpretar a los
imaginarios en la forma más abstracta posible.
Debe ser notado como una ilustración más de esta idea de la pareja ordenada,
que el punto M en la fig. 9 es la pareja (+3, 0), el punto N es la pareja (0, +1), el punto
M’ la pareja )0,3(− , el punto N’ la pareja )1,0(− , y el punto 0 la pareja (0, 0).
Otra forma de representar la pareja ordenada (x,y) es pensando en ella como
representando la línea punteada 0P (Cf. fig. 8), en vez del punto P. De esta forma, la
pareja ordenada representa una línea trazada desde un “origen”, 0, de una cierta longitud
y en una cierta dirección. La línea 0P puede ser llamada la línea vectorial de 0 a P, o el
paso de 0 a P. Podemos ver, por lo tanto, que en este capítulo solamente hemos
extendido la interpretación formal que dimos de los números positivos y negativos. Este
método de representación por vectores es muy útil cuando consideramos el significado
que debe ser asignado a las operaciones de adición (suma) y multiplicación de las
parejas ordenadas.
Entraremos ahora en esta cuestión, y preguntaremos qué significado
encontramos conveniente para asignar a la adición (suma) de las dos parejas ordenadas
(x,y) y (x’,y’). La interpretación debe (a) hacer que el resultado de la adición (suma) sea
otra pareja ordenada, (b) hacer la operación conmutativa, de tal forma que (x,y) +
(x’,y’)=(x’,y’), (x,y), (c) hacer la operación asociativa para que
{( x,y)+(x’,y’)}+( u,v)=(x,y)+{(x’,y’)+(u,v)},
(d) hacer el resultado de la sustracción (resta) único, para que cuando busquemos
determinar la pareja ordenada incógnita (x,y) para satisfacer la ecuación
(x,y)+(a,b)=(c,d),
solamente hay una y una única respuesta que podamos representar por
),(),(),( badcyx −= .
Todos estos requisitos son satisfechos si tomamos (x,y)+(x’,y’) para significar la pareja
ordenada (x+x’, y+y’). De acuerdo con esto, por definición ponemos
(x,y)+(x’,y’)= (x+x’, y+y’).
56
Nótese que aquí hemos adoptado el hábito matemático de usar el mismo símbolo + en
sentidos diferentes. El símbolo + en la parte izquierda de la ecuación tiene el nuevo
significado de + que estamos definiendo ahora; mientras que los dos símbolos + en la
parte derecha tienen el significado de la adición (suma) de números positivos y
negativos (operaciones), que fue definido en el último capítulo. Ninguna confusión
práctica surge de este doble uso.
Como ejemplos de adición tenemos
(+3, +1) + (+2, +6) = (+5, +7),
)1,3( −+ + )6,2( −− = )7,1( −+ ,
(+3, +1) + )1,3( −− = (0, 0).
Queda entonces establecido para nosotros el significado de sustracción.
Encontramos que
),(),(),( vyuxvuyx −−=− .
Así
(+3, +2) - (+1, +1) = (+2, +1),
y
)2,1()4,2()2,1( +−=−+−−+ ,
y
)5,3()3,2()2,1( −−=++−−− .
Es fácil ver que
),(),(),(),( vuyxvuyx −−+=− .
También
(x,y) - (x,y) = (0, 0).
Por lo tanto, (0, 0) debe ser visto como la pareja ordenada cero. Por ejemplo
(x,y) + (0, 0) = (x,y).
La representación pictórica de la adición de parejas ordenadas es sorprendentemente
fácil.
57
Fig. 10
Dejemos que 0P represente (x,y) de modo que 0M=x y PM=y; dejemos que 0Q
represente (x1,y1) de modo que 0M1=x1 y QM1=y1. Completemos el paralelogramo 0PRQ
por las líneas punteadas PR y QR, entonces la diagonal 0R es la pareja ordenada (x+x1,
y+y1). La línea PS es paralela a 0X; entonces, evidentemente, los triángulos 0QM1 y
PRS son en todos los aspectos iguales. Por lo tanto, MM’=PS=x1, y RS=QM1; y
entonces
0M’=0M+MM’= x+x1,
RM’=SM’+RS=y+y1
Así, 0R representa la pareja ordenada como es requerido. Esta figura puede ser
también trazada con 0P y 0Q en otros cuadrantes.
Es obvio que aquí hemos vuelto a la ley del paralelogramo, que fue mencionada
en el capítulo VI, sobre las leyes del movimiento siendo aplicadas a velocidades y
fuerzas. Debe ser recordado que, si 0P y 0Q representan dos velocidades, se dice que
una partícula se está moviendo con una velocidad igual a las dos velocidades sumadas si
se está moviendo con la velocidad 0R. En otras palabras, se dice que 0R es el resultante
de las dos velocidades 0P y 0Q. Las fuerzas actuando en un punto de un cuerpo pueden
ser representadas por líneas de igual forma que las velocidades; y la misma ley del
paralelogramo sigue siendo válida, a saber, que el resultante de las dos fuerzas 0P y 0Q
58
es la fuerza representada por la diagonal 0R. De esto se sigue que podemos considerar a
las parejas ordenadas como representando una velocidad o una fuerza, y la regla que
acabamos de dar para la adición de parejas ordenadas representa las leyes
fundamentales de la mecánica para la adición de fuerzas y velocidades. Una de las
características más fascinantes de las matemáticas es el modo en que las ideas y
resultados de diferentes partes de la materia encajan unos con otros. Durante las
discusiones de este y de los capítulos precedentes hemos sido guiados simplemente por
las consideraciones más abstractas de las matemáticas puras; y sin embargo, al final de
ellos, hemos llegado de nuevo a las leyes más fundamentales de la naturaleza, leyes que
deben estar en la mente de cualquier ingeniero cuando diseña un motor, y de cualquier
arquitecto naval cuando calcula la estabilidad de un barco. No es ninguna paradoja decir
que en nuestros estados de ánimo más teóricos podemos estar más cerca que nunca de
nuestras más prácticas aplicaciones.
59
CAPÍTULO VIII
NÚMEROS IMAGINARIOS (Continuación)
La definición de la multiplicación de parejas ordenadas es guiada por
exactamente las mismas consideraciones que las de la adición. La interpretación de la
multiplicación debe ser tal que
(α) el resultado sea otra pareja ordenada,
(β) la operación sea conmutativa, a fin de que
(x,y)× (x’,y’) = (x’,y’) × (x,y),
(γ) la operación sea asociativa, a fin de que
{(x,y)× (x’,y’)} × (u,v)=(x,y)× {( x’,y’) × (u,v)},
(δ) debe hacer el resultado de la división único [con una excepción para el caso
de la pareja del cero (0, 0)], para que cuando busquemos determinar la pareja incógnita
(x,y) para satisfacer la ecuación
(x,y)× (a,b) = (c,d),
haya una y solamente una respuesta, que podamos representar por
(x,y) = (c,d) ÷ (a,b), o por (x,y) = ),(
),(
ba
dc.
(ε) Además, la ley que involucra a la adición y a la multiplicación, llamada ley
distributiva, debe ser satisfecha, a saber
(x,y)× {( a,b)+(c,d)} = {( x,y)× (a,b)}+{( x,y)× (c,d)}.
Todas estas condiciones (α), (β), (γ), (δ), (ε) pueden ser satisfechas por una
interpretación que, aunque parece complicada al principio, es capaz de una simple
interpretación geométrica.
Por definición ponemos
(x,y)× )','( yx = { )''( yyxx− , )''( yxxy+ } (A)
Esta es la definición del significado del símbolo × cuando está escrito entre dos
parejas ordenadas. Se sigue evidentemente de esta definición que el resultado de la
multiplicación es otra pareja ordenada, y que el valor de la parte derecha de la ecuación
(A) no se ve alterado por intercambiar simultáneamente x con x’, e y con y’. Por lo
tanto, las condiciones (α) y (β) están satisfechas. La prueba de la satisfacción de (γ), (δ)
y (ε) es igualmente fácil cuando hemos dado una interpretación geométrica, que
60
haremos en un momento. Pero antes de hacer esto, sería interesante hacer una pausa y
ver si hemos alcanzado el objetivo por el que toda esta elaboración empezó.
Llegamos a ecuaciones de la forma x2 = 3− , para las cuales no existía solución
en términos de números reales positivos y negativos. Después vimos que todas nuestras
dificultades desaparecían si podíamos interpretar la ecuación x2 = 1− , por ejemplo, si
podíamos definir )1(− para que )1(− × )1(− = 1− .
Ahora consideremos las tres parejas ordenadas especiales* (0,0), (1,0) y (0,1).
Ya hemos probado que
(x,y)+(0,0) = (x,y)
Además, ahora tenemos
(x,y)× (0,0) = (0,0).
Por consiguiente, tanto para la adición como para la multiplicación, la pareja
(0,0) juega el papel del cero en la aritmética y en el álgebra elementales; compárense las
ecuaciones de arriba con x+0=x, y con x×0=0.
De nuevo consideremos (1,0): esto juega el papel del 1 en la aritmética y álgebra
elementales. En estas ciencias elementales, la característica especial de 1 es que x×1=x,
para todos los valores de x. Ahora, de acuerdo con nuestra ley de multiplicación
(x,y)× (1,0) = { )0( −x , (y+0)} = (x,y).
Así, (1,0) es la unidad de pareja.
Consideremos finalmente (0,1): esto interpretará para nosotros el símbolo
)1(− . El símbolo debe entonces poseer la propiedad característica de que
)1(− × )1(− = 1− . Ahora, por la ley de multiplicación de parejas ordenadas tenemos
(0,1)× (0,1) = { )10( − , (0+0)} = )0,1(− .
Pero (1,0) es la unidad de pareja, y )0,1(− es la unidad de pareja negativa; de
modo que (0,1) tiene la propiedad deseada. Existen, sin embargo, dos raíces previstas de
1− , a saber, ± )1(− . Consideremos )1,0(− ; de nuevo recordando aquí que 1)1( 2 =− ,
encontramos, )1,0(− × )1,0( − = )0,1(− .
De esta forma, )1,0(− es la otra raíz cuadrada de )1(− . De acuerdo con esto,
las parejas ordenadas (0,1) y )1,0(− son las interpretaciones de ± )1(− en términos de
* En lo siguiente, seguiremos la costumbre de omitir el signo + en lo posible; así, (1, 0) es (+1, 0) y (0, 1) es (0, +1).
61
parejas ordenadas. ¿Pero cuál corresponde a cuál? ¿(0,1) corresponde a + )1(− y
)1,0( − a )1(−− , o (0,1) a )1(−− y )1,0( − a + )1(− ? La respuesta es que es
perfectamente indiferente que simbolismo adoptemos.
Las parejas ordenadas pueden ser divididas en tres tipos, (i) el tipo “imaginario
complejo” (x,y), en donde ni x ni y son cero; (ii) el tipo “real” (x,0); (iii) el tipo
“imaginario puro” (0,y). Consideremos las relaciones que estos tipos tienen unos con
otros. Primero multipliquemos la pareja del tipo “imaginario complejo” (x,y) con la
pareja del tipo “real” (a,0), y obtenemos
(a,0)× (x,y) = (ax,ay).
Así, el efecto es simplemente multiplicar cada término de la pareja (x,y) por el
número real - positivo o negativo - a.
Segundo, multipliquemos la pareja del tipo “imaginario complejo” (x,y) con la
pareja del tipo “imaginario puro” (0,b), y obtenemos
(0,b)× (x,y) = ),( bxby− .
Aquí el efecto es más complicado, y será mejor comprendido en la interpretación
geométrica a la que procederemos después de estudiar otros tres casos especiales.
Tercero, multipliquemos la pareja “real” (a,0) con la imaginaria (0,b), y
obtenemos
(a,0)× (0,b) = (0,ab).
Cuarto, multipliquemos las dos parejas “reales”, (a,0) y (a’,0), y obtenemos
(a,0)× (a’,0) = (aa’,0).
Quinto, multipliquemos las dos “parejas imaginarias”, (0,b) y (0,b’), y
obtenemos
)0,'()',0(),0( bbbb −=× .
Ahora centremos nuestra atención en la interpretación geométrica, comenzando
con unos casos especiales. Tomemos las parejas (1,3) y (2,0) y consideremos la
ecuación
(2,0)× (1,3) = (2,6)
62
En el diagrama (fig. 11), el vector 0P representa (1,3), el vector 0N representa
(2,0) y el vector 0Q representa (2,6). Así, el producto (2,0)× (1,3) es encontrado
geométricamente al tomar la longitud del vector 0Q como el producto de las longitudes
de los vectores 0P y 0N, y (en este caso) al producir que 0P a Q sea de la longitud
requerida. De nuevo, consideremos el producto (0,2)× (1,3), tenemos
(0,2)× (1,3) = )2,6(− .
El vector 0N corresponde a (0,2) y el vector 0R a )2,6(− . De esta forma, 0R -
que representa el nuevo producto - está en ángulos rectos a 0Q, además de poseer la
misma longitud. Nótese que tenemos a la misma ley regulando la longitud de 0Q como
en el caso previo, a saber, que su longitud es el producto de las longitudes de los dos
vectores que son multiplicados; pero ahora que tenemos a 0N1 a lo largo del eje “de
ordenadas” 0Y, en lugar de 0N a lo largo del eje “de abscisas” 0X, la dirección de 0P se
ha convertido a través de un ángulo recto.
Hasta ahora, en estos ejemplos de multiplicación, hemos visto al vector 0P como
modificado por los vectores 0N y 0N1. Debemos obtener una pista para la ley general de
la dirección al invertir el modo de pensar sobre esto, y pensar en los vectores 0N y 0N1
como modificados por el vector 0P. La ley de la longitud se mantiene intacta; la
longitud resultante es la longitud del producto de los dos vectores. La nueva dirección
de la ampliada 0N (es decir, 0Q) es encontrada al rotarla en la dirección (opuesta a las
manecillas del reloj) de rotación desde 0X hasta 0Y a través de un ángulo igual al
63
ángulo P0X: es un accidente de este caso particular que esta rotación haga que 0Q se
extienda a lo largo de la línea 0P. De nuevo, consideremos el producto de 0N1 y 0P; la
nueva dirección de la ampliada 0N1 (es decir, 0R), es encontrada al rotar 0N en la
dirección (opuesta a las manecillas del reloj) de rotación a través de un ángulo igual al
ángulo P0X, a saber, el ángulo N10R es igual al ángulo P0X.
La regla general para la representación geométrica de la multiplicación puede ser
enunciada así:
El producto de los dos vectores 0P y 0Q es un vector 0R, cuya longitud es el
producto de las longitudes de 0P y 0Q y cuya dirección 0R es tal que el ángulo R0X es
igual a la suma de los ángulos P0X y Q0X.
Por lo tanto, podemos concebir al vector 0P como haciendo rotar al vector 0Q a
través de un ángulo P0X (es decir, el ángulo R0Q = al ángulo P0X), o al vector 0Q
haciendo rotar al vector 0P a través de un ángulo Q0X (es decir, el ángulo R0P = al
ángulo Q0X).
No probaremos esta ley general, porque ello implicaría entrar en procedimientos
matemáticos más técnicos que exceden los fines de este libro. Pero ahora podemos ver,
de manera inmediata, que la ley asociativa [señalada con (γ) arriba] para la
multiplicación está satisfecha. Consideremos primero la longitud del vector resultante;
64
ésta se obtiene por medio del proceso ordinario de multiplicación para números reales; y
así, la ley asociativa es suficiente para ella.
Por otra parte, la dirección del vector resultante se obtiene por medio de la
simple adición (suma) de los ángulos, y la ley asociativa es suficiente para la dirección
también.
Se ha dicho lo necesario sobre la multiplicación. Hemos indicado de manera
rápida, al considerar la multiplicación y la adición, cómo puede ser construida, sobre un
plano, un álgebra o un “cálculo” de vectores, que es tal que cualesquiera dos vectores en
el plano pueden ser sumados, o restados, y pueden ser multiplicados o divididos uno por
otro.
No hemos considerado los detalles técnicos de todos estos procesos porque nos
llevaría demasiado lejos en detalles matemáticos; pero hemos mostrado el modo general
de proceder. Cuando interpretamos nuestros símbolos algebraicos de esta forma,
estamos empleando “cantidades imaginarias” o “cantidades complejas”. Estos términos
son solamente referencias, y tenemos demasiado sobre qué pensar como para detenernos
a preguntar si son términos bien escogidos o no.
El resultado neto de nuestras investigaciones es que cualesquiera ecuaciones
como x+3 = 2 o (x+3)2 = 2− pueden siempre ser interpretadas en términos de vectores,
y encontrar soluciones para ellas. Al buscar por tales interpretaciones debe tenerse en
cuenta que 3 se convierte en (3,0), 2− se convierte en )0,2(− , y x es la pareja
“incógnita” (u,v): así que las dos ecuaciones se convierten, respectivamente, en
(u,v)+(3,0) = (2,0) y en {(u,v)+(3,0)}2 = )0,2(− .
Hemos resuelto completamente las dificultades iniciales que atrajeron nuestra
atención tan pronto como consideramos los elementos del álgebra. La ciencia como tal
es mucho más compleja en ideas que aquella con la que nosotros empezamos. En
realidad, hemos creado una ciencia diferente y totalmente nueva que servirá a todos los
propósitos por los cuales la vieja ciencia fue inventada, e incluso más. Pero, antes de
felicitarnos a nosotros mismos por los resultados de nuestra labor, debemos mitigar una
sospecha que para este tiempo debió haber surgido en la mente del estudiante. La
pregunta que el lector debe estar haciéndose es: ¿Dónde va a parar toda esta invención
de nuevas interpretaciones? Es verdad que hemos conseguido interpretar al álgebra de
tal suerte que siempre seamos capaces de resolver una ecuación cuadrática como
0422 =+− xx ; pero existen un sin fin de otras ecuaciones, por ejemplo,
65
0423 =+− xx , x4+x3+2 = 0, etc., sin ningún límite. ¿Tenemos que hacer una nueva
ciencia cada vez que una nueva ecuación aparece?
Si este fuese el caso, todas nuestras investigaciones precedentes - aunque para
algunas mentes puedan parecer divertidas - tendrían una importancia insignificante.
Pero el gran hecho que ha hecho el análisis moderno posible, es que, con la ayuda de
este cálculo de vectores, cada fórmula que surge puede recibir su interpretación propia;
y la cantidad “incógnita” en cada ecuación puede ser demostrada para indicar algún
vector. De este modo, la ciencia está completa en sí misma, por lo menos en lo que a sus
ideas fundamentales concierne. Recibió su forma definitiva al mismo tiempo que la
máquina de vapor estaba siendo perfeccionada, y seguirá siendo una gran y poderosa
arma para que el pensamiento consiga la victoria sobre las cosas cuando los curiosos
especímenes de esa máquina se muestren en los museos junto con los cascos y las
corazas de épocas más antiguas.
66
CAPÍTULO IX
GEOMETRÍA DE COORDENADAS
Los métodos y las ideas de la geometría de coordenadas han sido ya empleados
en los capítulos anteriores. Es tiempo de que los consideremos en sí mismos más de
cerca; y, al hacerlo, debemos fortalecer nuestros lazos con otras ideas que ya hemos
alcanzado. En el presente capítulo, así como en los siguientes, regresaremos a la idea de
los números reales positivos y negativos, e ignoraremos a los números imaginarios,
introducidos en los dos últimos capítulos.
Hemos estado usando continuamente la idea de que, al considerar dos ejes en un
plano, X0X’ e Y0Y’, cualquier punto P en ese plano puede ser determinado en posición
por un par de números positivos o negativos x e y, donde (Cf. fig. 13) x es la longitud
0M e y es la longitud PM. Esta concepción, tan simple como parece, es la idea principal
de la geometría de coordenadas. Su descubrimiento marca una gran época en la historia
del pensamiento matemático. Se debe al filósofo DESCARTES (como ya ha se ha
dicho), y se le ocurrió que podría constituir un importante método matemático mientras
estaba acostado en su cama.
67
Los filósofos, cuando han poseído un conocimiento matemático preciso y exhaustivo,
han enriquecido a la ciencia con muchas de sus mejores ideas. Por otra parte, debe
decirse que, con muy pocas excepciones, todas las observaciones sobre las matemáticas
hechas por aquellos filósofos que han poseído un escaso o precipitado conocimiento
sobre las matemáticas han resultado inútiles, siendo siempre triviales o incorrectas. El
hecho es ciertamente curioso; debido a que las ideas fundamentales de las matemáticas
parecen ser, después de todo, muy simples, incluso casi infantiles, parecen
desenvolverse bien en la esfera del pensamiento filosófico. Es probablemente su misma
simplicidad la causa del error; no estamos acostumbrados a pensar en cosas abstractas
tan sencillas, y es necesario un largo entrenamiento para asegurarnos una inmunidad
parcial ante el error tan pronto como nos desviamos del agotado camino del
pensamiento.
El descubrimiento de la geometría de coordenadas, y también el de la geometría
proyectiva, casi al mismo tiempo, ilustra otro hecho que se ha presentado de manera
continua en la historia del pensamiento, a saber, que algunos de los más grandes
descubrimientos se deben hacer de entre los temas mejor y más conocidos. En el siglo
diecisiete, la geometría había sido ya estudiada por más de dos mil años, aún cuando
instauremos su fecha de nacimiento con los griegos. EUCLIDES (n. 330 a. C.), quien
enseñó en la Universidad de Alejandría, sistematizó y extendió el trabajo de una larga
serie de predecesores, algunos de ellos de gran genio. Después de él, generaciones y
generaciones de matemáticos trabajaron en el mejoramiento de la materia.
Afortunadamente, la geometría no sufrió de aquella fatal barrera al progreso, a saber,
que su estudio estuviera confinado o reducido a un pequeño grupo de hombres de origen
y puntos de vista similares, sino todo lo contrario. En el siglo diecisiete, la geometría
había pasado por las mentes de los egipcios, de los griegos, de los árabes y de los
alemanes. Y, aún después de todo el trabajo dedicado a esta ciencia durante tantas
épocas y por tantos hombres de mentes tan diversas, sus secretos más importantes aún
no se habían descubierto. Nadie pudo haber estudiado los principios elementales de la
geometría sin haber percibido la falta de un método que sirviera como guía. Cada
proposición tiene que ser probada por una exhibición de ingenuidad; y, a una ciencia
para la que esto es cierto, le falta el gran requisito del pensamiento científico: el método.
Las remotas deducciones de una ciencia matemática no son muy importantes
teóricamente. La ciencia no ha sido perfeccionada, hasta que consista, en esencia, en la
exposición de métodos propios relacionados unos con otros por los que la información,
68
sobre cualquier tema que tenga que ver con la materia, pueda ser fácilmente obtenida. El
crecimiento de una ciencia no se debe a su aumento, sino a sus ideas; cuanto más crecen
las ideas, menos son las deducciones que valen la pena hacer constar.
Desafortunadamente, las matemáticas están siempre estorbadas por la repetición, en los
libros de texto, de innumerables proposiciones subsidiarias, cuya importancia se ha
perdido por su absorción en casos particulares de verdades más generales y - como ha
hemos insistido - la generalidad es el alma de las matemáticas.
La geometría de coordenadas ilustra también otra característica de las
matemáticas a la que ya hemos aludido, a saber, que las ciencias matemáticas, mientras
se desarrollan, encajan unas con otras y comparten las mismas ideas en común. No es
exagerado decir que las distintas ramas de las matemáticas experimentan un perpetuo
proceso de generalización y que, a medida que se generalizan, se unen. Aquí de nuevo
la razón de esto se encuentra en la misma naturaleza de la ciencia, su generalidad, es
decir, del hecho de que la ciencia trata con verdades generales que se aplican a todas las
cosas en virtud de su propia existencia como cosas. En esta conexión, el interés de la
geometría de coordenadas se encuentra en el hecho de que relaciona conjuntamente a la
geometría - que empezó siendo la ciencia del espacio - con el álgebra - que tuvo sus
orígenes en la ciencia del número -.
Recordemos ahora las principales ideas de las dos ciencias, y veamos después
cómo se relacionan gracias al método de coordenadas de DESCARTES. Tomemos al
álgebra en primer lugar. No nos complicaremos la existencia al recurrir a los
imaginarios, y sólo pensaremos en los números reales con signos positivos o negativos.
La idea fundamental es la de un número cualquiera, el número variable, que es denotado
por una letra y no por cualquier número definido. Después procedemos a la
consideración de las correlaciones entre las variables. Por ejemplo, si x e y son dos
variables, podemos concebirlas como correlacionadas por las ecuaciones x+y = 1, o por
1=− yx , o en cualquier otra forma. Esto a la vez nos conduce a la aplicación de la idea
de la forma algebraica. Pensamos, de hecho, en cualquier correlación interesante de
cualquier tipo, yendo desde la concepción inicial de los números variables a la
concepción secundaria correlaciones variables de los números. De esta forma,
generalizamos la correlación x+y = 1, en la correlación ax+by = c. Aquí a, b, y c, siendo
letras, representan cualesquiera números y son de hecho variables ellas mismas. Pero
son las variables que determinan la correlación variable; y la correlación, cuando es
determinada, correlaciona los números variables x e y. Las variables del tipo a, b, y c de
69
arriba, que son usadas para determinar la correlación, son llamadas “constantes” o
parámetros. El uso del término “constante” en esta conexión para lo que es realmente
una variable puede parecer extraño al principio, pero realmente es muy natural. Y esto
es porque la investigación matemática tiene que ver con la relación entre las variables x
e y, después de que a, b, c hayan sido determinadas. Así que en un sentido, relativo a x e
y, las “constantes” a, b, y c son constantes. En consecuencia, ax+by = c representa el
ejemplo general de una cierta forma algebraica, a saber, el de una correlación variable
perteneciente a cierta clase.
Entonces generalizamos x2+y2 = 1 en ax2+by2 = c, o, aún más, en ax2+2hxy+by2
= c, o, aún más, en ax2+hxy+by2+2gx+2fy = c. Aquí de nuevo nos vemos llevados a
correlaciones variables que están indicadas por sus distintas formas algebraicas.
Ahora pasemos a la geometría. El nombre de la ciencia nos recuerda a figuras y
diagramas exhibiendo triángulos, rectángulos, cuadrados y círculos, todos ellos en
relaciones especiales unos con otros. El estudio de las simples propiedades de estas
figuras es la materia principal de la geometría elemental, tal como es normalmente
introducida al principiante. A pesar de eso, un pensamiento menos superficial sobre el
tema demuestra que esa no es la verdadera concepción de la materia. Es conveniente
para un niño que comience sus razonamientos geométricos sobre las formas, como los
triángulos y los cuadrados, que ha recortado con unas tijeras. ¿Pero qué es, no obstante,
un triángulo? Es una figura marcada y limitada por tres trozos de tres líneas rectas.
Ahora bien, la limitación de espacios por trozos de líneas es una idea muy
complicada, y de ninguna manera una idea que dé alguna esperanza para poder exhibir
las simples concepciones generales que deberían formar la columna vertebral de la
materia. Buscamos algo más simple y más general. Fue esta obsesión con las ideas
iniciales erróneas- por cierto, sumamente naturales y buenas para la creación de los
primeros pensamientos sobre el tema - la causa de esterilidad del estudio de la ciencia
durante tantos siglos. La geometría de coordenadas, y DESCARTES su inventor, deben
tener el crédito de divulgar los objetos simples y verdaderos del pensamiento
geométrico.
En lugar de pensar en un trozo de una línea recta, pensemos en el todo de una
línea recta a lo largo de su interminable longitud en ambas direcciones. Este es el tipo
de idea general desde la cual debemos empezar nuestras investigaciones geométricas.
Parece ser que los griegos nunca encontraron algún uso para esta concepción, que es
fundamental para todo el pensamiento geométrico moderno. EUCLIDES siempre
70
contempla una línea recta como trazada entre dos puntos definidos, y es muy cuidadoso
al mencionar cuándo la línea debe ser producida más allá de estos segmentos. Nunca
piensa en la línea como una entidad dada de una vez por todas como un todo. Esta
cuidadosa definición y limitación, para excluir un infinito no inmediatamente aparente a
los sentidos, fue muy característica de los griegos en todas sus distintas actividades.
Está manifestada en la diferencia entre la arquitectura griega y la gótica, y entre la
religión griega y la moderna. La torre en una catedral gótica y la importancia de una
línea recta ilimitada en la geometría moderna son características emblemáticas de la
transformación del mundo moderno.
La línea recta, considerada como un todo, es la idea principal desde la que parte
la geometría moderna. Pero también otros tipos de líneas se nos ocurren, y así llegamos
a la concepción de la curva completa, que en cada punto exhibe alguna característica
uniforme, así como la línea recta exhibe en todos los puntos la característica de rectitud.
Por ejemplo, el círculo exhibe, en todos los puntos, la característica de estar a una
distancia dada desde su centro; y también está la elipse, que es una curva ovalada, tal
que la suma de las dos distancias de cualquier punto en ella desde dos puntos fijos,
llamados focos, es constante para todos los puntos en la curva. Es evidente que un
círculo es simplemente un caso particular de una elipse cuando los dos focos están
superpuestos en el mismo punto; porque entonces la suma de las dos distancias es
meramente el doble del radio del círculo. Los antiguos conocían las propiedades de la
elipse y del círculo y, desde luego, los consideraban, a cada una, como un todo. Por
ejemplo, EUCLIDES nunca empieza con simples segmentos (es decir, trozos) de
círculos, que luego se prolongarían, sino que siempre considera al círculo como un todo,
tal como fue descrito. Es ciertamente desafortunado que el círculo no sea la línea
fundamental en la geometría, a fin de que su consideración deficiente sobre la línea
recta pudiera haber tenido menores consecuencias.
Esta idea general de una curva que en cualquier punto de ella exhibe alguna
propiedad uniforme es llamada en geometría “lugar geométrico”. Un lugar geométrico
es la curva (o superficie, si no queremos confinarnos al plano) formada por puntos,
todos de los cuales poseen alguna propiedad dada. A cada propiedad en relación unas
con otras que los puntos puedan tener, corresponde algún lugar geométrico, que consiste
en todos los puntos que posean la propiedad. Al investigar las propiedades de un lugar
geométrico considerado como un todo, consideramos cualquier punto o puntos en el
lugar geométrico. De manera que en la geometría nos encontramos de nuevo con la idea
71
fundamental de la variable. Además, al clasificar a los lugares geométricos con títulos
como líneas rectas, círculos, elipses, etc., encontramos de nuevo la idea de la forma.
De acuerdo con esto, así como en el álgebra nos ocupamos de números
variables, correlaciones entre los números variables, y de la clasificación de las
correlaciones en tipos bajo la idea de la forma algebraica; así en la geometría nos
ocupamos de los puntos variables, de los puntos variables satisfaciendo alguna
condición para formar un lugar geométrico, y de la clasificación de lugares geométricos
en tipos bajo la idea de las condiciones de la misma forma.
La esencia de la geometría de coordenadas es la identificación de la correlación
algebraica con el lugar geométrico. El punto en un plano es representado en el álgebra
por sus dos coordenadas, x e y, y la condición satisfecha por cualquier punto en el lugar
geométrico es representada por la correspondiente correlación entre x e y. Finalmente, a
las correlaciones expresables en alguna forma algebraica general, tal como ax+by = c,
les corresponden lugares geométricos de algún tipo general, cuyas condiciones
geométricas son todas de la misma forma. Hemos llegado a un punto en donde podemos
efectuar un intercambio completo de ideas y resultados entre las dos ciencias. Cada una
de ellas arroja luz sobre la otra, y cada una gana un poder inconmensurable. Es
imposible no sentirse agitado al pensar en las emociones de hombres de ciertos
momentos históricos de aventura y descubrimiento: Colón cuando vio por vez primera
la costa occidental, Pizarro cuando observó el Océano Pacífico, Franklin cuando apreció
la chispa eléctrica que venía del lazo de su cometa, GALILEO cuando giró por vez
primera su telescopio hacia los cielos. Tales momentos se les conceden también a los
estudiantes en las regiones abstractas del pensamiento, y muy arriba de entre todos ellos
debe estar la mañana cuando DESCARTES estaba costado en la cama e inventó el
método de la geometría de coordenadas.
Cuando uno ha comprendido la idea de la geometría de coordenadas, la cuestión
inmediata que le viene a la mente es ¿qué tipos de lugares geométricos corresponden a
las bien conocidas formas algebraicas? Por ejemplo, la más simple de entre los tipos
generales de formas algebraicas es ax+by = c. El tipo de lugar geométrico que
corresponde a esto es una línea recta, y a la inversa de cada línea recta corresponde una
ecuación de esta forma. Es una fortuna que lo más simple de entre los lugares
geométricos corresponda a lo más simple de entre las formas algebraicas. En realidad,
es esta correspondencia general de simplicidad geométrica y algebraica lo que otorga a
este tema su poder. Surge del hecho de que la conexión entre geometría y álgebra no es
72
casual ni artificial, sino profunda y esencial. La ecuación que corresponde a un lugar
geométrico es llamada la ecuación del (o “al”) lugar geométrico. Algunos ejemplos de
ecuaciones de líneas rectas nos ayudarán a comprender mejor el tema.
Consideremos 0=− xy ; aquí a, b, y c de la forma general han sido
reemplazados por 1, 1− , y 0 respectivamente. Esta línea pasa a través del “origen”, 0,
en el diagrama y forma una bisectriz* del ángulo X0Y. Esta es la línea L’0L del
diagrama. El hecho de que pase por el origen, 0, es fácil de ver al observar que la
ecuación es satisfecha al poner x = 0 e y = 0 simultáneamente, y 0 y 0 son las
coordenadas de 0. En realidad, es también fácil generalizar y ver por el mismo método
que la ecuación de cualquier línea a través del origen es de la forma ax+by = 0. El lugar
geométrico de la ecuación y+x = 0 también pasa a través del origen y divide al ángulo
X’0Y en dos partes iguales: es la línea L10L1’ del diagrama.
Consideremos ahora 1=− xy : el lugar geométrico correspondiente no pasa a través del
origen. Por lo tanto tenemos que buscar dónde corta los ejes. Debe cortar al eje de x en
algún punto de las coordenadas x y 0. Al poner y = 0 en la ecuación, obtenemos x = 1− ;
así que las coordenadas de este punto (A) son 1− y 0. De manera similar, para el punto
(B) donde la línea corta el eje 0Y las coordenadas son 0 y 1. El lugar geométrico es la
línea AB en la figura y es paralela a L0L’. De manera similar, y+x = 1 es la ecuación de * Es decir, divide en dos partes iguales al ángulo. Nota del Traductor.
73
la línea A1B de la figura; y el lugar geométrico es paralelo a L10L1’. Es fácil probar el
teorema general de que dos líneas representadas por ecuaciones de las formas ax+by = 0
y ax+by = 0 son paralelas.
El grupo de lugares geométricos a los que nos referiremos ahora es lo
suficientemente importante como pare que ocupe otro capítulo. Pero antes de eso,
pensaremos un poco más sobre las principales ideas de este tema.
La posición de cualquier punto P es determinada al escoger arbitrariamente un
origen, 0, dos ejes, 0X y 0Y en ángulos rectos, y después al señalar sus coordenadas x e
y, es decir, 0M y PM. También, como vimos en el último capítulo, P puede ser
determinada por el “vector” 0P, donde la idea del vector incluye una dirección y una
longitud determinadas. Desde un punto de vista matemáticamente abstracto, la idea de
un origen arbitrario podría parecer artificial y tosca, y similarmente para los ejes 0X y
0Y trazados arbitrariamente. Pero en relación con la aplicación de las matemáticas a los
eventos del Universo, estamos simbolizando con franca simplicidad el hecho más
fundamental respecto al punto de vista del mundo que nos ofrecen nuestros sentidos.
Cada uno de nosotros dirige nuestras percepciones sensibles de las cosas a un origen
que llamamos “aquí”: nuestra ubicación en una parte especial del espacio alrededor de
la cual agrupamos a todo el Universo es el hecho específico de nuestra existencia
corporal. Podemos imaginar seres que observan todos los fenómenos en todo el espacio
con un mismo ojo, siendo imparciales a favor de cualquier parte. Con nosotros sucede
lo contrario, un cato en nuestros pies reclama más atención que un terremoto en Cabo de
Hornos, o que la destrucción de un mundo en la Vía Láctea. Es verdad que al construir
un conocimiento común con los otros humanos tenemos que renunciar a algo del
egoísmo de nuestro “aquí” individual. Sustituimos “cerca de aquí” por “aquí”; así,
medimos millas desde el ayuntamiento de la ciudad más cercana, o desde la capital del
país. En la medición de la Tierra, los hombres de ciencia pondrían el origen en el centro
de aquella; de la misma manera que los astrónomos ponen su origen en el centro del
Sol. Pero, por más lejos que este último origen pueda estar, e incluso si vamos más allá
y lo ponemos en el centro de las estrellas fijas más cercanas, comparado con los
inconmensurables infinitos del espacio, es cierto que nuestro primer procedimiento al
explorar el Universo es fijar un origen “cerca de aquí”.
De nuevo la relación de las coordenadas 0M y MP (es decir, x e y) al vector 0P
es un caso de la famosa ley del paralelogramo, como puede verse fácilmente (Cf.
diagrama) al completar el paralelogramo 0MPN. La idea del “vector” 0P, esto es, de una
74
magnitud dirigida, es la idea principal de la ciencia física. Cualquier cuerpo en
movimiento tiene una cierta magnitud de velocidad en una cierta dirección o, lo que es
lo mismo, su velocidad es una magnitud dirigida, un vector. Una fuerza tiene una cierta
magnitud y una dirección definida. Así, cuando son introducidas las ideas de “origen”,
“coordenadas”, y “vectores” en la geometría analítica, estamos estudiando las
concepciones abstractas que corresponden a los hechos fundamentales del mundo físico.
75
CAPÍTULO X
SECCIONES CÓNICAS
Cuando los geómetras griegos estaban exhaustos, como ellos pensaban, de las
más obvias e interesantes propiedades de figuras hechas de líneas rectas y círculos,
dirigieron su atención al estudio de otras curvas; y, con su casi infalible instinto para
acertar en las cosas sobre las que vale la pena pensar, se dedicaron a las secciones
cónicas, es decir, a las curvas en las que los planos cortan las superficies de los conos
circulares. El hombre que tiene el crédito de inventar este estudio es MENECMO (375-
325 a. C.), alumno de PLATÓN y uno de los tutores de Alejandro Magno. Este último,
por cierto, es un gran ejemplo de las ventajas de la buena instrucción, porque otro de sus
tutores fue el filósofo ARISTÓTELES. Podemos suponer que Alejandro encontraba a
MENECMO un profesor aburrido, porque se sabe que alguna vez le pidió que hiciera
las pruebas más cortas, a lo que MENECMO respondió: “En el país hay caminos
privados e incluso reales, pero en la geometría hay un mismo camino para todos”. Esta
respuesta fue lo suficientemente verdadera en el sentido de que fue entendida
inmediatamente por Alejandro. Pero si MENECMO pensaba que sus pruebas no podían
ser más cortas, estaba gravemente equivocado; y la mayoría de los matemáticos
modernos estarían terriblemente aburridos si fueran obligados a estudiar las pruebas
griegas para las propiedades de las secciones cónicas. Nada ilustra mejor el aumento de
poder que es obtenido por la introducción de ideas relevantes en una ciencia que el
observar la progresiva reducción de las pruebas que acompaña al crecimiento de la
abundancia de ideas. Existe un cierto tipo de matemático que siempre está impaciente al
tratar con las ideas de una materia: está siempre ansioso por obtener las pruebas de los
problemas “importantes”. La historia de la ciencia está totalmente en contra de él. Sin
duda existen caminos reales* en la ciencia; pero aquellos que primero los pisan son
hombres de genio, y no reyes.
La forma en la que las secciones cónicas se presentaron por primera vez en las
mentes de los matemáticos fue como sigue: pensemos en un cono (Cf. fig. 15), cuyo
* Whitehead utiliza la palabra “royal” para referirse a “reales”. La palabra de Whitehead (“royal”) se refiere a real en un sentido político-social, a saber, “los caminos de la monarquía o de los reyes”. Lo mismo para el ejemplo de Alejandro Magno y la respuesta de Menecmo. Nota del Traductor.
76
vértice (o punto) es V, de pie sobre una base circular STU. Por ejemplo, la sombra
cónica de una luz eléctrica es un tipo de tal superficie. Ahora dejemos que todas las
generatrices* que pasan a través de V y yacen en la superficie sean producidas al revés;
el resultado es un doble cono, y PQR es otra sección circular en el lado opuesto de V a
la sección circular STU. El eje del cono CVC’ pasa a través de todos los centros de
estos círculos y es perpendicular a sus planos, que son paralelos el uno al otro. En el
diagrama las partes de las curvas que se supone yacen detrás del plano del papel son
líneas punteadas, y las partes en el plano o enfrente de él son líneas continuas. Ahora
supongamos que este doble cono es cortado por un plano no perpendicular al eje CVC’
o, por lo menos, no necesariamente perpendicular. Entonces surgen tres casos:
(1) El plano puede cortar al cono en una curva oval cerrada, tal como ABA’B’,
que se encuentra en uno de los dos medio-conos. En este caso el plano no se encontrará
con el otro medio-cono de ninguna manera. Tal curva es llamada elipse; es una curva
ovalada. Un caso particular de tal sección del cono es cuando el plano es perpendicular
al eje CVC’, entonces la sección, tal como STU o PQR, es un círculo. Por lo tanto, el
círculo es un caso particular de elipse.
(2) El plano puede ser paralelo a una de las generatrices del cono, como por
ejemplo el plano de la curva D1A1D1 en el diagrama es paralelo a la generatriz VS; la
curva está todavía confinada a uno de los medio-conos, pero ahora no es una curva oval
cerrada, sino que sigue sin fin siempre y cuando la generatriz del medio-cono sea
producida lejos del vértice. Tal sección cónica se llama parábola.
(3) El plano puede cortar ambos medio-conos, de tal manera que la curva
completa consiste en dos porciones separadas, o “ramas” como son llamadas; este caso
está ilustrado por las dos ramas G2A2G2 y L2A2L2, que conjuntamente conforman la
curva. Ninguna rama está cerrada, cada una de ellas se extiende sin fin mientras los dos
medio-conos estén prolongados lejos del vértice. Tal sección cónica se llama hipérbola.
Existen, por lo tanto, tres tipos de secciones cónicas, a saber, las elipses, las
parábolas y las hipérbolas. Es fácil reconocer que, en un sentido, las parábolas son casos
límite que se encuentran entre las elipses y las hipérbolas. Ellas forman un tipo más
especial y tienen que satisfacer una condición más particular. Estos tres nombres se
deben aparentemente a APOLONIO DE PERGA (n. alrededor de 260 a. C. - alrededor
* Líneas que conforman una figura geométrica. Nota del Traductor.
77
de 200 a. C.), quien escribió un tratado sistemático sobre secciones cónicas que se
mantuvo como el trabajo estándar hasta el siglo dieciséis.
Debe ser evidente a la vez cuán incómoda y difícil debió haber sido para los
geómetras griegos la investigación de las propiedades de estas curvas.
Las curvas son curvas planas, y aún así su investigación requiere trazar en perspectiva
una figura sólida. Así que en el diagrama de arriba prácticamente no tenemos trazadas
líneas subsidiarias y con todo eso la figura es lo suficientemente complicada.
78
Las curvas son curvas planas, y parece obvio que podríamos ser capaces de definirlas
sin ir más allá del plano, esto es, sin tener que recurrir a una figura sólida.
Al mismo tiempo, así como en la definición “sólida” hay un método uniforme de
definición - a saber, la sección de un cono por un plano - que produce tres casos, así
también en la definición “plana” debe haber un método uniforme de proceder que
79
produzca tres casos. Sus formas, cuando son trazadas en sus planos, son aquellas de las
líneas curvas en las tres figuras 16, 17 y 18.
Los puntos A y A’ en la figura son llamados los vértices y la línea AA’ el eje mayor.
Debe ser notado que una parábola (Cf. fig. 17) tiene solamente un vértice. APOLONIO
probó* que la proporción de PM a AM.MA’, esto es,
MAAM
PM
.
2
se mantiene constante
tanto para la elipse como para la hipérbola (figs. 16 y 18), y que la proporción de PM2 a
AM es constante para la parábola de la fig. 17; y basó la mayor parte de su trabajo en
este hecho. Estamos evidentemente avanzando hacia la deseada definición uniforme que
no va más allá del plano; pero aún no hemos alcanzado la suficiente uniformidad.
En los diagramas 16 y 18, dos puntos, S y S’, están marcados, y en el diagrama
17, un punto, S. Estos son los focos de las curvas, y son puntos de la mayor
importancia. APOLONIO sabía que para una elipse la suma de SP y S’P (es decir,
SP+S’P) es constante, mientras P se mueva en la curva y es igual a AA’. Similarmente
para una hipérbola la diferencia SPPS −' es constante, e igual a AA’ cuando P está en
una rama, y la diferencia, ''' PSSP− , es constante e igual a AA’ cuando P esté en la otra
rama. Pero ningún punto correspondiente parecía existir para la parábola.
* Cf. Ball, loc. cit., para este aporte de Apolonio y Pappus.
80
Finalmente, 500 años después, el último gran geómetra griego, PAPPUS DE
ALEJANDRÍA, descubrió el secreto final que completó esta línea de pensamiento. En
los diagramas 16 y 18 hay dos líneas, XN y X’N’, y en el diagrama 17 la única línea
XN. Estas son las directrices de las curvas, dos para la elipse, dos para la hipérbola, y
una para la parábola. Cada directriz corresponde a su foco más cercano. La propiedad
característica de un foco, S, y su correspondiente directriz, XN, para cualquiera de los
tres tipos de curva, es que la proporción SP a PN, es decir, PN
SP, es constante, donde PN
es la perpendicular en la directriz de P, y P es cualquier punto en la curva. Hemos por
fin encontrado la deseada propiedad de las curvas que no requiere que nos vayamos del
plano, y está fijada uniformemente para las tres curvas. Para las elipses, la proporción
PN
SP es menor a 1, para las parábolas es igual a 1, y para las hipérbolas es mayor a 1.
Cuando PAPPUS terminó sus investigaciones, debió sentir que, aparte de
extensiones menores, el tema estaba prácticamente agotado; y si hubiera podido prever
el transcurso de la historia de la ciencia por más de mil años, hubiera confirmado sus
creencias. Aunque en verdad las ideas más fructíferas en conexión con esta rama de las
matemáticas no habían sido ni siquiera tocadas, y nadie hubiera pensado acerca de sus
sumamente importantes aplicaciones en la naturaleza. Ninguna advertencia más
impresionante puede darse a aquellos que confinan el conocimiento y la investigación a
lo que es aparentemente útil, que la reflexión de que las secciones cónicas fueron
estudiadas como simple ciencia abstracta por más de dieciocho siglos, sin más utilidad
que la de satisfacer el anhelo de conocimiento de los matemáticos, y que, después de
este largo periodo de estudio abstracto, se encontró que esta ciencia constituía la llave
necesaria con la que se podía alcanzar el conocimiento de una de las más importantes
leyes de la naturaleza.
Mientras tanto, el estudio de la astronomía, ajeno a las secciones cónicas, había
seguido evolucionando. El gran astrónomo griego PTOLOMEO (muerto en 168 d. C.),
publicó su tratado estándar sobre la materia en la Universidad de Alejandría, explicando
los movimientos aparentes entre las estrellas fijas del Sol y los planetas por la
concepción de que la Tierra estaba en reposo y el Sol y los planetas dando vueltas
alrededor. Durante los siguientes trece siglos el número y la exactitud de las
observaciones astronómicas creció, con el resultado de que la descripción de los
movimientos de los planetas dada por PTOLOMEO se volvió cada vez más y más
81
complicada. COPÉRNICO (1473-1543) señaló que los movimientos de estos cuerpos
celestes podría ser explicado de una manera más simple si se supusiera que el Sol está
en reposo, y la Tierra y los planetas fueron concebidos como moviéndose alrededor de
él. Sin embargo, todavía pensó en estos movimientos como esencialmente circulares,
aunque modificados por un conjunto de pequeñas correcciones superpuestas
arbitrariamente a los movimientos circulares primarios. Así quedó el asunto cuando
KEPLER nació en 1571 en Stuttgart, Alemania. Había dos ciencias, una era la
geometría de las secciones cónicas y la otra era la astronomía; ambas habían sido
estudiadas desde tiempos remotos sin la menor sospecha de ninguna conexión entre
ellas. KEPLER era un astrónomo, pero era también un geómetra muy capaz, y en lo que
a secciones cónicas se refiere, había llegado a ideas avanzadas para su época. Él es uno
de los muchos ejemplos que refutan la falsedad de la idea de que el éxito en la
investigación científica demanda una exclusiva absorción en una única y estrecha línea
de estudio. Las nuevas ideas son más aptas para surgir de mentes con una inusual
variedad de conocimiento - no necesariamente conocimiento vasto - y con una
concepción de los métodos e ideas de las distintas líneas del pensamiento. Debe
recordarse que Charles Darwin llegó a su concepción de la ley de la evolución al leer el
famoso Ensayo sobre la población de Malthus, un tema que trataba de un tema diferente
o, por lo menos, así se pensaba.
KEPLER enunció tres leyes del movimiento planetario, las primeras dos en
1609, y la tercera diez años después. Son las siguientes:
(1) Las órbitas de los planetas son elipses, el Sol siendo el foco.
(2) Mientras un planeta se mueve en su órbita, el radio vector del Sol al planeta
barre áreas iguales en tiempos iguales.
(3) Los cuadrados de los tiempos periódicos de los distintos planetas son
proporcionales a los cubos de sus ejes mayores.
Estas leyes probaron ser sólo un paso hacia el desarrollo de una teoría más fundamental
de estas ideas. NEWTON (1642-1727) concibió la idea de la gravitación universal, a
saber, que cualesquiera dos piezas de materia se atraen entre ellas con una fuerza
proporcional al producto de sus masas e inversamente proporcional al cuadrado de sus
distancias. Esta majestuosa ley general, acoplada con las tres leyes generales del
movimiento que puso en la forma general final, probó ser adecuada para explicar todos
los fenómenos astronómicos, incluyendo las leyes de KEPLER, y ha sido la base de la
física moderna. Entre otras cosas, probó que los cometas se pueden mover en elipses
82
muy alargadas, o en parábolas, o en hipérbolas, que son casi parábolas. Los cometas que
regresan - como el cometa de Halley - se deben mover, desde luego, en elipses. Pero el
paso esencial en la prueba de la ley de la gravitación - e incluso en la sugestión de su
concepción inicial - fue la verificación de las leyes de KEPLER conectando los
movimientos de los planetas con la teoría de las secciones cónicas.
Desde el siglo diecisiete en adelante, la teoría abstracta de las curvas ha
colaborado con el doble renacimiento de la geometría debido a la introducción de la
geometría de coordenadas y de la geometría proyectiva. En la geometría proyectiva las
ideas fundamentales se agrupan alrededor de la consideración de conjuntos (o haces,
como son llamados) de líneas pasando a través de un punto común (el vértice del
“haz”).
Ahora bien, (Cf. fig. 19) si A, B, C, D, son cualesquiera cuatro puntos fijos en una
sección cónica y P es un punto variable en la curva, el haz de líneas PA, PB, PC, y PD,
tiene una propiedad especial, conocida como la constancia de su proporción doble. Será
suficiente decir aquí que la proporción doble es una idea fundamental en la geometría
proyectiva. Para la geometría proyectiva esta es realmente la definición de las curvas, o
alguna propiedad análoga que es equivalente a ella. Se verá qué tan lejos, en el curso de
siglos de estudio, nos hemos alejado de la vieja idea original de las secciones de un
cono circular. Ahora sabemos que los griegos se habían aferrado a una propiedad menor
83
de relativamente pequeña importancia; aunque por alguna fortuna divina las curvas en sí
mismas merecieron toda la atención que se les dio. Este elemento no importante de la
idea de “sección” está ahora eliminado en la ordinaria fraseología matemática, que
simplemente dice “cónicas” en lugar de “secciones cónicas”.
Finalmente, regresamos al punto en el que dejamos a la geometría de
coordenadas en el último capítulo. Habíamos preguntado cuál era el tipo de lugares
geométricos correspondiente a la forma algebraica general ax+by = c, y encontramos
que era la clase de líneas rectas en un plano. Vimos también que cada línea recta posee
una ecuación de esta forma, y que cada ecuación de esta forma corresponde a una línea
recta. Ahora queremos ir al siguiente tipo general de formas algebraicas. Esto se
consigue evidentemente al introducir términos que involucren a x2, xy, e y2. Así, la
nueva forma general debe ser escrita como sigue:
ax2+2hxy+by2+2gx+2fy+c = 0
¿Qué representa esto? La respuesta es que siempre representa una sección cónica, y,
además, que la ecuación de cada sección cónica puede siempre ser puesta en esta forma.
La discriminación de los tipos particulares de cónicas dados por esta forma de ecuación
es muy fácil. Depende enteramente de la consideración de 2hab− , donde a, b, y h son
las “constantes”, como está escrito arriba. Si 2hab− es un número positivo, la curva es
una elipse; si 02 =− hab , la curva es una parábola; y si 2hab− es un número negativo,
la curva es una hipérbola.
Por ejemplo, pongamos a = b = 1, h = g = f = 0, c = 4− . Entonces tenemos la
ecuación x2+y2 4− = 0. Es fácil probar que esta es la ecuación de un círculo, cuyo
centro está en el origen, y el radio es 2 unidades de longitud. Ahora, 2hab− se vuelve
2011 −× , esto es, 1, y es por lo tanto positivo. Por consiguiente, el círculo es un caso
particular de la elipse, como debe ser. Generalizando, la ecuación de cualquier círculo
puede ser puesta en la forma a(x2+y2)+2gx+2fy+c = 0. Por tanto, 2hab− se vuelve
02 −a , esto es, a2, que es necesariamente positivo. De acuerdo con esto, todos los
círculos satisfacen la ecuación de las elipses.
La forma general de la ecuación de una parábola es
(dx+ey)2+2gx+2fy+c = 0,
de tal forma que los términos del segundo grado, como son llamados, pueden escribirse
como un cuadrado perfecto. Para hacerlo, tenemos
d2x2+2dexy+e2y2+2gx+2fy+c;
84
de tal forma que por comparación a = d2, h = de, b = e2, y entonces
0)( 2222 =−=− deedhab . Por consiguiente, la condición necesaria está
automáticamente satisfecha. La ecuación 042 =−xy , donde a = b = g = f = 0, h = 1,
4−=c , representa una hipérbola, porque la condición 2hab− se vuelve 210− , esto es,
1− , que es negativo.
Algunos casos excepcionales que son incluidos en la forma general de la
ecuación pueden no ser inmediatamente reconocidos como secciones cónicas. Al
escoger debidamente las constantes la ecuación puede ser hecha para representar dos
líneas rectas. Se puede decir que dos líneas rectas que se intersectan encajan en la idea
griega de una sección cónica. Porque, al referirnos al dibujo del doble cono de arriba, se
puede ver que algunos planos a lo largo del vértice, V, cortan el cono en un par de líneas
rectas que intersectan en V. El caso de dos líneas rectas paralelas puede ser incluido al
considerar un cilindro circular como un caso particular de un cono. Entonces un plano,
que lo corte y que sea paralelo a su eje, lo cortará en dos líneas rectas paralelas. De
cualquier manera, hayan permitido o no los griegos que estos casos especiales sean
llamados secciones cónicas, éstos están incluidos entre las curvas representadas por la
forma algebraica general del segundo grado. Vale la pena señalar este hecho, porque es
característico de las matemáticas modernas el incluir, entre sus formas generales, todo
tipo de casos particulares que antaño hubieran recibido un tratamiento especial. Esto se
debe a la búsqueda de generalidad.
85
CAPÍTULO XI
FUNCIONES
El uso matemático del término función ha sido adoptado de igual manera en la
vida diaria. Por ejemplo, en la frase “Su humor es una función de su digestión”, el
término es utilizado exactamente en este sentido matemático. Significa que puede ser
asignada una regla por la cual sabremos cuál será su humor si sabemos cómo está
trabajando su digestión. Es claro que la idea de “función” es demasiado simple, y
solamente nos queda ver cómo es aplicada en las matemáticas a números variables.
Pensemos primero en algunos ejemplos concretos: si un tren ha estado viajando a razón
de veinte millas por hora, la distancia (s millas) recorrida después de cualesquiera
número de horas t, está dada por s = 20× t, siendo s una función de t. También 20× t es
la función de t con la que s es idéntica. Si John es un año mayor que Thomas, entonces,
cuando Thomas tenga cualquier edad en x años, la edad de John (en y años) está dada
por y = x+1, e y es una función de x, a saber, es la función x+1.
En estos ejemplos, t y x son llamados los “argumentos” de las funciones en las
que aparecen. Así, t es el argumento de la función 20× t, y x es el argumento de la
función x+1. Si s = 20× t, e y = x+1, entonces s e y son llamados los “valores” de las
funciones 20× t y x+1, respectivamente.
Volviendo al caso general, podemos definir una función matemática como una
correlación entre dos números variables, llamados respectivamente el argumento y el
valor de la función, de tal forma que cualquier valor que es asignado al “argumento de
la función”, el valor del “valor de la función” está definitivamente (es decir,
únicamente) determinado. Lo contrario no es necesariamente verdadero, a saber, que
cuando el valor de la función esté determinado, el argumento estará también únicamente
determinado. Otra funciones del argumento x son y = x2, y = 2x2+3x+1, y = x, y = log x,
y = sen x. Las últimas dos funciones de este grupo serán inmediatamente reconocidas
por aquellos que sepan un poco de álgebra y de trigonometría. No es necesario
explicarlas, ya que solamente fueron escritas a modo de ejemplo.
Hasta este punto, aunque hemos definido lo que queremos decir cuando
hablamos de una función en general, únicamente hemos mencionado una serie de
funciones especiales. Pero las matemáticas, fieles a sus métodos generales de proceder,
86
simbolizan la idea general de cualquier función. Y lo hacen al escribir F(x), f(x), g(x),
φ(x), etc., para cualquier función de x, donde el argumento x es puesto entre paréntesis y
alguna letra como F, f, g, φ, etc., es prefijada al paréntesis para que represente la
función. Sin embargo, esta notación tiene sus defectos, porque obviamente se enfrenta a
la convención de que las letras particulares deben representar números variables; porque
aquí F, f, g, φ, etc., prefijadas a un paréntesis, representan funciones variables. Es fácil
dar ejemplos en donde tengamos que confiar en nuestro sentido común y en el contexto
para saber qué es lo que se pretende decir si se usa este tipo de notación. Una forma de
evadir la confusión es usar letras griegas (por ejemplo, φ de arriba) para las funciones;
otra forma es mantener para f y F (las letras iniciales de la palabra función) la letra de la
función y, si otras funciones variables tienen que ser simbolizadas, tomar una letra
adyacente como g.
Con estas explicaciones y precauciones, escribimos y = f(x) para denotar que y es
el valor de alguna función indeterminada del argumento x, donde f(x) puede ser
cualquier cosa tal como x+1, x2 2− x+1, sen x, log x, o simplemente x en sí misma. El
punto esencial es que cuando x es dada, entonces y es de este modo definitivamente
determinada. Es importante tener muy clara la generalidad de esta idea. Así, en y = f(x),
podemos determinar, si queremos, que f(x) signifique que cuando x es un número
entero, f(x) sea cero, y que cuando x tenga cualquier otro valor, f(x) sea 1. De acuerdo
con esto, al poner y = f(x), con esta elección para el significado de f, y es ó 0 ó 1, de
acuerdo a si el valor de x es entero o no. Así, f(1) = 0, f(2) = 0, f
3
2= 1, f ( )2 = 1,
etc. Esta elección para el significado de f(x) da una función muy buena del argumento x
de acuerdo con la definición general de una función.
Una función, que después de todo no es más que una especie de correlación
entre dos variables, está representada, como otras correlaciones, por una gráfica, que
está en vigor por los métodos de la geometría de coordenadas. Por ejemplo, la fig. 2 del
capítulo II es la gráfica de la función v
1 , donde v es el argumento y p el valor de la
función. En este caso la gráfica está trazada solamente para valores positivos de v, que
son los únicos valores que poseen algún significado para la aplicación física considerada
en ese capítulo. De nuevo, en la fig. 14 del capítulo IX, la longitud total de la línea AB,
ilimitada en ambas direcciones, es la gráfica de la función x+1, donde x es el argumento
e y es el valor de la función; y en la misma figura, la línea ilimitada A1B es la gráfica de
87
la función 1 x− , y la línea L0L’ es la gráfica de la función x, siendo x el argumento e y
el valor de la función.
Estas funciones, que pueden ser expresadas por las simples fórmulas
algebraicas, son adaptadas para ser representadas por gráficas. Pero para algunas
funciones esta representación puede ser engañosa sin una explicación detallada, o puede
resultar incluso imposible. Así, consideremos la función mencionada arriba, que tiene el
valor 1 para todos los valores de su argumento x, excepto para aquellos que sean
enteros, por ejemplo, para x = 0, x = 1, x = 2, etc., en cuyo caso tendrá el valor 0.
Fig. 20
Su aspecto en una gráfica sería el de una línea recta ABA’ trazada paralelamente
al eje X0X’ a una distancia de éste de 1 unidad de longitud. Pero los puntos C1, C2, C3,
C4, etc., correspondientes a los valores 1, 2, 3, 4, etc., del argumento x, se omiten, y en
lugar de ellos debemos considerar a los puntos B1, B2, B3, B4, etc., en el eje 0X. Es fácil
encontrar funciones para las cuales la representación gráfica sea no sólo inconveniente
sino imposible. Las funciones que no se prestan a gráficas son importantes en las
matemáticas más elevadas, pero no necesitamos preocuparnos más de ellas aquí.
La división de funciones más importante es aquella que las divide en funciones
continuas y discontinuas. Una función es continua cuando su valor solamente se altera
de forma gradual por las alteraciones graduales del argumento, y es discontinua cuando
el valor se puede alterar por “saltos bruscos” o “repentinos”. De esta forma, las dos
88
funciones x+1 y x 1− , cuyas gráficas están representadas como líneas rectas en la Fig.
14 del capítulo IX, son funciones continuas, y también lo es la función v
1 , representada
en el capítulo II, si solamente pensamos en valores positivos para v. Pero la función
representada en la Fig. 20 de este capítulo es discontinua, ya que en los valores x = 1, x
= 2, etc., de su argumento, su valor da “saltos bruscos”.
Pensemos en algunos ejemplos de funciones presentes en la naturaleza, a fin de
que entre en nuestra cabeza el sentido real de continuidad y discontinuidad.
Consideremos un tren en su viaje a lo largo de la línea férrea, digamos desde la estación
de Euston hacia Londres. A lo largo de la línea aparecen, en orden, las estaciones de
Bletchley y Rugby. Sea t el número de horas que el tren ha recorrido desde Euston, y s
el número de millas que ha recorrido. Entonces s es una función de t, es decir, es el
valor variable correspondiente al argumento variable t. Si conocemos las circunstancias
de la trayectoria del tren, sabremos s tan pronto como cualquier valor especial de t nos
sea dado. Ahora bien, milagros aparte, podemos asumir naturalmente que s es una
función continua de t. Es imposible concebir al tren como llegando continuamente
desde Euston hasta Bletchley y que de pronto, sin ningún tiempo que intervenga y por
más corto que sea, el tren aparezca en Rugby. La idea es demasiado fantástica como
para que entre en nuestro cálculo: contempla posibilidades que no se encuentran fuera
de Las mil y una noches; e incluso en esos cuentos la discontinuidad pura del
movimiento difícilmente puede ser imaginada; no se atreven a desafiar a nuestra
credulidad con algo más que velocidades anormales. Pero las velocidades anormales no
son ninguna contradicción para la gran ley de la continuidad del movimiento que
aparentemente existe en la naturaleza. Tan es así, que la luz se mueve a una razón de
aproximadamente 190,000 millas por segundo* y viene a nosotros desde el Sol en siete
u ocho segundos; pero, a pesar de esta velocidad, su distancia recorrida es siempre una
función continua del tiempo.
No resulta tan obvio para nosotros que la velocidad de un cuerpo sea
invariablemente una función continua del tiempo. Consideremos al tren en cualquier
tiempo t, moviéndose a alguna velocidad definida, digamos v millas por hora, donde v
es cero cuando el tren está en reposo en una estación y es negativa cuando el tren está
avanzando en reversa. Ahora estamos dispuestos a admitir que v no puede de repente
cambiar su valor por causa de un gran y pesado tren. Ciertamente, el tren no puede estar * Aproximadamente 305,000 kilómetros por segundo. Nota del traductor.
89
avanzando a cuarenta millas por hora de las 11.45 AM hasta el mediodía y, de pronto,
sin ningún lapso o intervalo de tiempo, empezar a avanzar a 50 millas por hora.
Tenemos que admitir que el cambio de velocidad será un proceso gradual. ¿Pero qué
sucede con los golpes repentinos con una magnitud adecuada? Supongamos que dos
trenes chocan; o, para tomar objetos más pequeños, supongamos que un hombre patea
un balón de fútbol. Ciertamente parecería a nuestros sentidos como si el balón
comenzara de pronto a moverse. Así, en el caso de la velocidad, nuestros sentidos no se
perturban con la idea de que aquella sea una función discontinua del tiempo, como sí lo
hicieron con la idea del tren siendo instantáneamente transportado desde Bletchley hasta
Rugby. De hecho, si las leyes del movimiento - con su concepción de masa - son
verdaderas, no existe tal cosa como la velocidad discontinua en la naturaleza. Cualquier
cosa que parezca a nuestros sentidos como un cambio discontinuo de velocidad debe ser
considerado, de acuerdo con estas leyes, como un caso de cambio gradual que es muy
rápido como para ser percibido por nosotros. Sería imprudente, sin embargo,
apresurarse a la generalización de que no hay funciones discontinuas presentes en la
naturaleza. Un hombre que, confiado en que la altura media de la tierra sobre el nivel
del mar entre Londres y París es una función continua de la distancia desde Londres,
camine de noche sobre el acantilado de Shakespeare en Dover contemplando la Vía
Láctea, acabaría muerto antes de que tuviera el tiempo para reorganizar sus ideas sobre
la necesidad de precaución con las conclusiones científicas.
90
Es sumamente fácil encontrar una función discontinua, incluso si nos limitamos a las
más simples de las fórmulas algebraicas. Por ejemplo, tomemos la función y = x
1 , que
ya hemos considerado bajo la forma p = v
1, donde v estuvo confinado a valores
positivos. Pero ahora dejemos que x tenga cualquier valor, positivo o negativo. La
gráfica de la función se muestra en la Fig. 21. Supongamos que x cambia continuamente
desde un valor negativo grande a través de un conjunto numéricamente decreciente de
valores negativos hasta el 0, y de ahí incrementándose a través de la serie de valores
positivos. De acuerdo con esto, si un punto que se esté moviendo, M, representa x en
X0X’, M empieza en el extremo izquierdo del eje X0X’ y se mueve sucesivamente a lo
largo de M1, M2, M3, M4, etc. Los puntos correspondientes en la función son P1, P2, P3,
P4, etc. Es fácil ver que hay un punto de discontinuidad en x = 0, esto es, en el origen 0.
Y esto es así porque el valor de la función en el lado negativo (izquierdo) del origen se
vuelve interminablemente grande, pero negativo, y la función reaparece en el lado
positivo (derecho) como interminablemente grande pero positiva. Por lo tanto, no
importa qué tan pequeños sean M2, M3, hay un salto finito entre los valores de la
función en M2 y M3. En realidad, este caso tiene la peculiaridad de que mientras más
pequeños sean M2, M3 (siempre y cuando “encierren” al origen), más grande es el salto
en valor de la función entre ellos. En esta gráfica se pone de manifiesto lo que es
también aparente en la Fig. 20 de este capítulo, esto es, que para muchas funciones lo
discontinuo solamente ocurre en puntos aislados, de modo que si restringimos los
valores del argumento obtenemos una función continua para estos valores restantes. Es
por lo tanto evidente que si en la Fig. 21 en y = x
1, nos restringimos solamente a valores
positivos y excluimos el origen, obtenemos una función continua. Similarmente para la
misma función, si nos restringimos solamente a los valores negativos, excluyendo el
origen, es continua. De nuevo la función graficada en la Fig. 20 es continua entre B y
C1, y entre C1 y C2, y entre C2 y C3, etc., excluyendo siempre en cada caso a los puntos
finales. Sin embargo, es fácil encontrar funciones en donde lo discontinuo ocurre en
todos los puntos. Por ejemplo, consideremos una función f(x), tal que cuando x es
cualquier número fraccionario f(x) = 1, y que cuando x sea cualquier número irreal o
inconmensurable, f(x) = 2. Esta función es discontinua en todos los puntos.
91
Finalmente, volveremos a pensar en la definición de continuidad que dimos
arriba. Hemos dicho que una función es continua cuando su valor solamente se altera
gradualmente por alteraciones graduales del argumento, y es discontinua cuando éste
puede alterar al valor por saltos bruscos o repentinos. Esta es exactamente el tipo de
definición que satisfizo a nuestros antepasados matemáticos y que ya no satisface a los
matemáticos modernos. Vale la pena dedicarle un tiempo, porque cuando hayamos
entendido las objeciones hechas a esta definición, habremos avanzado un largo trecho
en la comprensión del espíritu de las matemáticas modernas. La diferencia más grande
entre las matemáticas viejas y las nuevas es que los términos vagos y un poco
metafóricos como “gradualmente” ya no son tolerados en sus declaraciones. Las
matemáticas modernas solamente admiten declaraciones, definiciones y argumentos que
empleen exclusivamente las pocas y simples ideas acerca del número, magnitud y
variables sobre los que la ciencia está fundada. Entre dos números, uno puede ser mayor
o menor que el otro, y uno puede ser tal y tal un múltiplo del otro, pero no existe una
relación de “gradualidad” entre dos números, y, por lo tanto, el término es inadmisible.
Esto podría parecer a primera vista una gran pedantería. Para esta acusación hay dos
respuestas. En primer lugar, durante la primera mitad del siglo diecinueve, grandes
matemáticos, especialmente ABEL y WEIERSTRASS, descubrieron que grandes partes
de las matemáticas enunciadas bajo las viejas formas eran simplemente incorrectas.
Thomas Macaulay*, en su ensayo sobre BACON, contrasta la certeza de las
matemáticas con la incertidumbre de la filosofía; y por medio de un ejemplo retórico
afirma: “No ha habido reacción en contra del teorema de Taylor†”. No pudo haber
escogido un peor ejemplo. Porque, sin haber hecho una revisión de los libros de texto
ingleses sobre matemáticas de la época en la que se escribió el ensayo, la suposición
ignora que el teorema de Taylor fue enunciado y probado como erróneo cada vez. El
ansia de precisión de las matemáticas modernas es necesaria para la precisión. En
segundo lugar, es necesaria para la investigación. Es buena para la claridad y audacia
del pensamiento, y también para la fertilidad mental al intentar nuevas combinaciones
de ideas. Cuando las declaraciones iniciales son vagas y poco correctas, en cada paso
subsecuente del pensamiento el sentido común tiene que intervenir para limitar las
aplicaciones y para explicar los significados. En el pensamiento creativo el sentido
común es un mal maestro. Su único criterio para juzgar dicta que las nuevas ideas tienen
* Thomas Babington Macaulay (1800-1859), político, historiador y poeta británico. Nota del Traductor. † Brook Taylor (1685-1731), matemático británico. Nota del Traductor.
92
que parecerse a las viejas. En otras palabras, solamente puede actuar suprimiendo la
originalidad.
Al avanzar hacia una definición precisa de la continuidad (aplicada a las
funciones), debemos considerar más de cerca la declaración que afirma que no hay
relación de “gradualidad” entre los números. Se puede preguntar, ¿no puede un número
ser levemente más grande que otro número o, en otras palabras, no puede ser pequeña la
diferencia entre dos números? El punto central es que en un sentido abstracto - aparte de
alguna aplicación arbitraria - no existe tal cosa como un número grande o pequeño. Un
millón de millas es un número pequeño de millas para un astrónomo que investiga las
estrellas fijas, pero un millón de libras esterlinas es una gran sueldo anual. De nuevo, un
cuarto del sueldo de una persona es una fracción grande para ser donada a la caridad,
pero es una pequeña fracción si se piensa como lo único que va a usar esa persona para
sus cosas privadas. Se pueden enumerar interminables ejemplos para demostrar que
grande o pequeño no tienen, en ningún sentido, una aplicación abstracta en los números.
Podemos decir de dos números que uno es mayor o menor que el otro, pero no sin antes
especificar las circunstancias particulares que hacen que un número sea grande o
pequeño. Nuestra tarea es, por lo tanto, definir la continuidad sin hacer mención alguna
a conceptos como “pequeño” o cambio “gradual” en el valor de la función.
Para hacer esto, daremos nombres a ideas que también nos serán útiles cuando
más adelante consideremos los límites y el cálculo diferencial.
Un “intervalo” de valores del argumento x de una función f(x) es todos los
valores que están entre dos valores del argumento. Por ejemplo, el intervalo entre x=1 y
x=2 consiste en todos los valores que x puede tomar entre 1 y 2, es decir, consiste en
todos los números reales entre 1 y 2. Pero estos números no necesariamente tienen que
ser enteros. Un intervalo de valores del argumento contiene un número a, cuando a es
un miembro del intervalo. Por ejemplo, el intervalo entre 1 y 2 contiene 2
3,
3
5,
4
7, etc.
Un conjunto de números se aproxima a un número a dentro de una k estándar,
cuando la diferencia numérica entre a y cualquier número del conjunto es menor que k.
Aquí k es el “estándar de aproximación”. De esta forma, el conjunto de números 3, 4, 6,
8, se aproxima al número 5 dentro del estándar 4. En este caso el estándar 4 no es el más
pequeño que pudimos haber escogido; el conjunto también se aproxima a 5 dentro de
cualquiera de los estándares 3.1 o 3.01 o 3.001. De nuevo, los números 3.1, 3.141,
93
3.1415, 3.14159, se aproximan a 3.13102 dentro del estándar .032, y también dentro del
estándar más pequeño .03103.
Estas dos ideas de intervalo y aproximación a un número dentro de un estándar
son lo suficientemente sencillas; su única dificultad es que pueden parecer triviales.
Pero cuando son combinadas con nuestra siguiente idea, la de la “proximidad” de un
número, forman el fundamento del razonamiento matemático moderno. ¿Qué queremos
expresar cuando decimos que algo es verdadero para una función f(x) en la proximidad
del valor a del argumento x? Tenemos que hacer más precisa esta noción.
Los valores de una función f(x) poseen una característica en la “proximidad de
a” cuando algún intervalo pueda ser encontrado tal que, (i) contenga al número a no
como un punto final, y (ii) sea tal que cada valor de la función para los argumentos, que
no sean a y que esté dentro del intervalo, posea la característica. El valor f(a) de la
función para el argumento a puede o no poseer la característica. Nada está decidido en
este punto por declaraciones acerca de la proximidad de a.
Por ejemplo, supongamos que tomamos la función particular x2. En la
proximidad de 2, los valores de x2 son menores que 5. Porque podemos encontrar un
intervalo, por ejemplo desde 1 a 2.1, que (i) contenga a 2 no como punto final, y que (ii)
sea tal que, para valores de x estando dentro del intervalo, x2 sea menor que 5.
Ahora, combinando las ideas precedentes, sabemos qué es lo que se expresar
cuando decimos que en la proximidad de a la función f(x) se aproxima a c dentro del
estándar k. Esto significa que puede ser encontrado algún intervalo tal que (i) incluya a
a no como un punto final, y (ii) sea tal que todos los valores de f(x), donde x se
encuentra en el intervalo y no es a, difieren de c por menos de k. Por ejemplo, en la
proximidad de 2, la función x se aproxima a 1.41425 dentro del estándar .0001. Esto
es verdad porque la raíz cuadrada de 1.99996164 es 1.4142, y la raíz cuadrada de
2.00024449 es 1.4143; por lo tanto, para los valores de x que se encuentran en el
intervalo de 1.99996164 a 2.00024449, que contiene a 2 no como punto final, todos los
valores de la función x yacen entre 1.4142 y 1.4143, y, por lo tanto, todos difieren de
1.41425 por menos de .0001. En este caso podríamos, si queremos, fijar un estándar
más pequeño de aproximación, por ejemplo, .000051 o .0000501. De nuevo, para tomar
otro ejemplo, en la proximidad de 2, la función x2 se aproxima a 4 dentro del estándar
.5. Porque (1.9)2 = 3.61 y (2.1)2 = 4.41., y, de esta forma, ha sido encontrado el intervalo
requerido entre 1.9 y 2.1 que contenga a 2 no como punto final. Este ejemplo pone de
94
manifiesto el hecho de que las declaraciones sobre una función f(x) en la proximidad de
un número a son distintas de las declaraciones sobre el valor de f(x) cuando x=a. Es
requerida la producción de un intervalo, a través del cual la declaración sea verdadera.
Así, el simple hecho de que 22=4, no justifica por sí mismo el decir que en la
proximidad de 2 la función x2 es igual a 4. Esta declaración puede ser falsa, porque no
se puede producir ningún intervalo con la propiedad requerida. También, el hecho de
que 22=4, no justifica por sí mismo el decir que en la proximidad de 2 la función x2 se
aproxima a 4 dentro del estándar .5; aunque, en realidad, se haya probado la veracidad
de esta declaración.
Si entendemos las ideas precedentes, comprenderemos los fundamentos de las
matemáticas modernas. Recurriremos a ideas análogas en los capítulos sobre las series y
sobre el cálculo diferencial. Mientras tanto, estamos ya preparados para definir a las
“funciones continuas”. Una función f(x) es “continua” en un valor a de su argumento,
cuando en la proximidad de a sus valores se aproximan a f(a) (es decir, a su valor en a
dentro de cada estándar de aproximación).
Esto significa que, cualquier estándar k que escojamos, en la proximidad de a,
f(x) se aproxima a f(a) dentro del estándar k. Por ejemplo, x2 es continua en el valor 2 de
su argumento, x, porque con cualquier k escogido siempre podemos encontrar un
intervalo que (i) contenga a 2 no como un punto final, y (ii) sea tal que los valores de x2
para valores que se encuentren en el intervalo, se aproximen a 4 (es decir, 22) dentro del
estándar k. Así, supongamos que escogemos el estándar .1; (1.999)2=3.996001, y
(2.01)2=4.0401, y ambos difieren de 4 por menos de .1. Por consiguiente, dentro del
intervalo que va de 1.999 a 2.01, los valores de x2 se aproximan a 4 dentro de un
estándar .1. De manera similar, puede ser producido un intervalo para cualquier otro
estándar que queramos intentar.
Tomemos de nuevo el ejemplo del tren. Su velocidad es continua mientras pasa
por el puesto de cambio de agujas, si para cualquier velocidad que se quiera asignar
(digamos un millón de millas por hora), puede ser encontrado un intervalo de tiempo
que se extienda antes y después del instante en el que el tren pasa por este punto, tal que
en todos los instantes dentro del intervalo, la velocidad del tren difiera de aquella con la
que el tren pasó por el puesto de cambio por menos de un millón de millas por hora; y lo
mismo es verdad para cualquier otra velocidad que sea mencionada en lugar de la de un
millón de millas por hora.
95
CAPÍTULO XII
PERIODICIDAD EN LA NATURALEZA
Toda la vida de la naturaleza está dominada por la existencia de eventos
periódicos, esto es, por la existencia de eventos sucesivos tan análogos unos con otros
que, sin forzar demasiado al lenguaje, podríamos denominarlos como recurrencias del
mismo evento. La rotación de la Tierra produce la sucesión de los días. Es verdad que
cada día es diferente de los días precedentes, no importa qué tan abstracto sea nuestro
significado de día, como para poder excluir fenómenos casuales. Pero con una
definición del día lo suficientemente abstracta, la distinción en lo que a propiedades se
refiere entre dos días se vuelve tenue y remota de intereses prácticos; y cada día puede
ser concebido como una recurrencia del fenómeno de rotación de la Tierra. La
trayectoria de la Tierra alrededor del Sol conduce a la recurrencia anual de las
estaciones, e impone otra periodicidad sobre todas las operaciones de la naturaleza. Otro
tipo de periodicidad, aunque menos fundamental, es la derivada de las fases de la Luna.
En la vida moderna civilizada, donde la luz artificial es posible, estas fases son de poca
importancia, pero en los tiempos antiguos, en climas en donde los días quemaban y los
cielos aclaraban, la vida humana estuvo fuertemente determinada por la luz lunar. De
acuerdo con esto, nuestras divisiones en semanas y meses - con sus asociaciones
religiosas - se han propagado sobre los pueblos europeos desde Siria y Mesopotamia, a
pesar de que observaciones independientes sobre las fases de la Luna se encuentran en
prácticamente todas las naciones. Es, sin embargo, a través de las mareas, y no de sus
fases de luz y oscuridad, que la periodicidad lunar ha influido en la historia de la Tierra.
Nuestra vida corporal es esencialmente periódica. Está dominada por los latidos
del corazón, y por la recurrencia de la respiración. En realidad, la presuposición de
periodicidad es fundamental para nuestra concepción de la vida. Nos es imposible
imaginar un curso de la naturaleza en el que, a medida que los eventos ocurren, no
podamos decir: “Esto ha pasado antes”. Toda la concepción de la experiencia como guía
de conducta estaría ausente. Los hombres se encontrarían siempre en nuevas situaciones
sin poseer algún sustrato de identidad con cualquier cosa en la historia pasada. Los
96
mismos medios para medir el tiempo como una cantidad estarían ausentes. Los eventos
podrían todavía ser reconocidos como ocurriendo en una serie, de tal forma que algunos
fueran anteriores y otros posteriores, pero ahora vamos más allá de este reconocimiento
descubierto. No solamente podemos decir que tres eventos, A, B, C, ocurrieron en este
orden, de tal forma que A ocurrió antes que B, y B antes que C; sino que también
podemos decir que la longitud de tiempo entre los casos de A y B fue el doble de larga
que entre B y C. La cantidad del tiempo depende esencialmente de observar el número
de recurrencias naturales que han intervenido. Podemos decir que la longitud de tiempo
entre A y B fue de tantos días, o de tantos meses, o de tantos años, de acuerdo con el
tipo de recurrencia al que queramos apelar. De hecho, en el comienzo de la civilización,
estos tres modos de medir el tiempo eran muy distintos. Ha constituido una de las
primeras y principales tareas de la ciencia entre las naciones civilizadas y semi-
civilizadas el intentar fusionar estos modos en una única medida coherente, y el grado
de extensión de esta tarea debe ser realmente comprendido. Es necesario determinar, no
solamente qué número de días (por ejemplo, 365.25) van en algún año, sino determinar
previamente que el mismo número de días vayan en los años sucesivos. Podemos
imaginar un mundo en el que las periodicidades existen, pero no uno en donde dos
sistemas distintos sean coherentes. En algunos años podría haber 200 días y en otros
350. La determinación del ámbito general de consistencia de las periodicidades más
importantes fue el primer paso de la ciencia natural. Esta consistencia no surge de
alguna ley intuitiva del pensamiento abstracto, sino que es simplemente un hecho
observado de la naturaleza garantizado por la experiencia. De hecho, está tan lejos de
ser una ley necesaria, que no es ni siquiera exactamente verdadera. Existen divergencias
en cada caso. Para algunos casos, estas diferencias son fácilmente reconocibles, y, por
lo tanto, inmediatamente evidentes. En otros casos, se requiere de las más refinadas
observaciones y de una precisa exactitud astronómica para hacerlas evidentes. Hablando
en general, todas las recurrencias dependientes de seres vivos, tales como los latidos del
corazón, están sujetas, en comparación con otras recurrencias, a variaciones rápidas. Las
grandes recurrencias que son estables - en el sentido de que concuerdan mutuamente
con gran precisión - son aquellas dependientes del movimiento de la Tierra como un
todo, y de movimientos similares de los cuerpos celestes.
Es entonces cuando asumimos que estas recurrencias astronómicas señalan
intervalos iguales de tiempo. ¿Pero cómo podemos lidiar con las discrepancias que las
refinadas observaciones astronómicas detectan? Aparentemente, estamos aceptando la
97
presunción arbitraria de que uno u otro de estos conjuntos de fenómenos señalan
tiempos iguales - por ejemplo, que todos los días son de igual longitud, o que todos los
años son de igual longitud -. Esto no es así: algunas presunciones o suposiciones deben
ser hechas, pero la presunción que subyace en todo el procedimiento de los astrónomos
al determinar la medición del tiempo es que las leyes del movimiento están verificadas
de manera exacta. Antes de explicar cómo se hace esto, es interesante observar que esta
relegación de determinar la medida del tiempo a los astrónomos surge (como ya se ha
dicho) de la consistencia estable de las recurrencias con las que se ellos tratan. Si tal
consistencia superior hubiera sido observada entre las recurrencias características del
cuerpo humano, hubiéramos acudido naturalmente a los doctores de la medicina para
que regularan nuestros relojes.
Al considerar el asunto de las leyes del movimiento, piénsese en cómo dos
modos inconsistentes de medir el tiempo producirían diferentes variaciones de
velocidad al mismo cuerpo. Por ejemplo, supongamos que definimos una hora como
1/24 de un día, y tomemos el caso de un tren avanzando uniformemente durante dos
horas a razón de veinte millas por hora. Ahora consideremos una medida del tiempo
sumamente inconsistente, y supongamos que ésta hace que la primera hora sea el doble
de larga que la segunda. Entonces, de acuerdo con esta otra medida de duración, el
tiempo de trayectoria del tren está dividido en dos partes, durante cada una de las cuales
el tren ha recorrido la misma distancia, a saber, veinte millas; pero la duración de la
primera parte es el doble de larga que la de la segunda. Por lo tanto, la velocidad del
tren no ha sido uniforme, y, en promedio, la velocidad durante el segundo periodo es el
doble que durante el primer periodo. De esta forma, la cuestión acerca de si el tren ha
realizado un trayecto uniforme o no, depende del estándar de tiempo que adoptemos.
Para todos los propósitos ordinarios de la vida en la Tierra, las distintas
recurrencias astronómicas pueden ser vistas como absolutamente consistentes; y,
además de asumir su consistencia, y asumir, por lo tanto, las velocidades y cambios de
velocidades poseídas por estos cuerpos, encontramos que las leyes del movimiento, que
han sido consideradas arriba, son casi exactas. Pero solamente casi exactas cuando se
trata de algunos fenómenos astronómicos. Encontramos, sin embargo, que al asumir
velocidades ligeramente diferentes para las rotaciones y movimientos de los planetas y
de las estrellas, las leyes pueden ser verificadas de manera exacta. Se hace entonces esta
presunción; y hemos adoptado, de este modo, una medida del tiempo que está de hecho
definida por la referencia a los fenómenos astronómicos, pero no tanto como para ser
98
consistente con la uniformidad de cualquiera de ellos. Pero el principal hecho sigue
siendo que el flujo uniforme del tiempo en el que tantas cosas están basadas, es
dependiente de la observación de los eventos periódicos.
Incluso los fenómenos que a primera vista puedan parecer casuales y
excepcionales o que, por otra parte, se mantengan con una persistencia uniforme, se
pueden deber a la remota influencia de la periodicidad. Tomemos, por ejemplo, el
principio de la resonancia. La resonancia surge cuando dos conjuntos de circunstancias
conectadas tienen las mismas periodicidades. Una ley dinámica es que las pequeñas
vibraciones de todos los cuerpos, abandonados a sí mismos, tienen lugar en tiempos
definidos característicos del cuerpo. Así, un péndulo con una oscilación pequeña
siempre vibra en algún tiempo definido, característico de su forma y distribución de
peso y longitud. Un cuerpo más complicado puede tener muchas formas de vibrar, pero
cada una de estas formas de vibración tendrá sus “periodos” característicos.
Aquellos periodos de vibración de un cuerpo son llamados sus periodos “libres”. De
esta forma, un péndulo tiene un periodo de vibración, mientras que un puente
suspendido tendrá varios. Obtenemos un instrumento musical, como una cuerda de
violín, cuando los periodos de vibración son todos simples submúltiplos del más largo;
es decir, si t segundos son el periodo más largo, los otros son 2
1t,
3
1t, etc., donde
cualquiera de estos periodos más pequeños puede estar ausente. Ahora, supongamos que
excitamos las vibraciones de un cuerpo por una causa que es en sí misma periódica;
entonces, si el periodo de la causa es muy cercano a los periodos del cuerpo, el modo de
vibración del cuerpo será violentamente excitado, incluso si la magnitud de la causa
excitante es pequeña. Este fenómeno es conocido como “resonancia”. La razón general
es fácil de entender. Cualquiera que quiera perturbar a una piedra la empujará “en
sintonía” con las oscilaciones de la piedra, para poder siempre asegurar un momento
favorable para empujar. Si los empujes están fuera de sintonía, algunos incrementarán
las oscilaciones, pero otros las frenarán. Pero cuando están en sintonía, después de un
tiempo, todos los empujes son favorables. La palabra “resonancia” proviene de
consideraciones sobre el sonido; pero el fenómeno se extiende mucho más allá de la
región del aquel. Las leyes de absorción y emisión de la luz dependen de ella, así como
la “sintonización” de los receptores en la telegrafía sin cables, la importancia
comparativa de las influencias de los planetas en los movimientos de cada uno, el
peligro de un puente en suspensión mientras marcha por encima de él una tropa del
99
ejército, y la vibración excesiva de algunos barcos debido al ritmo de su maquinaria a
ciertas velocidades. Esta coincidencia de periodicidades puede producir fenómenos
estables cuando existe una asociación constante de los dos eventos periódicos, o puede
producir arrebatos violentos y repentinos cuando la asociación es fortuita y temporal.
De nuevo, los periodos característicos y constantes de vibración mencionados
arriba, son las causas subyacentes de lo que a nosotros aparece como excitaciones
estables de nuestros sentidos. Trabajamos por horas bajo una luz estable, o podemos
escuchar a un sonido estable e invariable. Pero, si la ciencia moderna está en lo cierto,
esta estabilidad no tiene contraparte en la naturaleza. La luz estable se debe al impacto
en el ojo de un sinnúmero de ondas periódicas en un éter vibrante, y el sonido estable se
debe a ondas similares en un aire vibrante. No es nuestro propósito explicar la teoría de
la luz o la teoría del sonido. Hemos dicho lo suficiente para hacer evidente que uno de
los primeros pasos necesarios para hacer de las matemáticas un instrumento adecuado
para la investigación de la naturaleza es que debe ser capaz de explicar la periodicidad
esencial de las cosas. Si hemos comprendido esto, podemos entender la importancia de
las concepciones matemáticas que vamos a considerar ahora, a saber, las funciones
periódicas.
100
CAPÍTULO XIII
TRIGONOMETRÍA
La trigonometría no surgió de la consideración general de la periodicidad en la
naturaleza. En este aspecto, su historia es análoga a la de las secciones cónicas, que tuvo
también su origen en ideas muy particulares. De hecho, una comparación de las
historias de las dos ciencias produce analogías y contrastes sumamente instructivos. La
trigonometría, al igual que las secciones cónicas, tuvo su origen entre los griegos. Su
inventor fue HIPARCO*, e hizo sus observaciones en la isla de Rodas. Sus servicios a la
astronomía fueron muy grandes, e hizo de ésta un tema verdaderamente científico,
estableciendo resultados e indicando los métodos a seguir para progresar en esta ciencia.
Probablemente la invención de la trigonometría no fue el menor de sus servicios
prestados a la ciencia. El siguiente hombre que extendió la trigonometría fue
PTOLOMEO, el gran astrónomo de Alejandría, y al que ya hemos mencionado. Ahora
consideraremos cuál es el gran contraste entre la trigonometría y las secciones cónicas.
El origen de la trigonometría fue práctico; fue inventada porque resultó necesaria para el
estudio astronómico. En cambio, el origen de las secciones cónicas fue puramente
teórico. La única razón para su estudio inicial fue el interés abstracto que producían sus
principales ideas. Es sumamente característico que el estudio de las secciones cónicas se
haya desarrollado alrededor de 150 años antes que el estudio de la trigonometría,
durante el mejor periodo del pensamiento griego. Pero la importancia de la
trigonometría, tanto en la teoría como en la aplicación de las matemáticas, es solamente
uno de los innumerables casos de ideas fructíferas que esta ciencia ha obtenido de las
aplicaciones prácticas.
Intentaremos dejar en claro qué es la trigonometría y por qué se generó del
estudio científico de la astronomía. En primer lugar, ¿cuáles son las mediciones que
puede hacer un astrónomo? Hay mediciones de tiempo y mediciones de ángulos. El
astrónomo puede ajustar un telescopio (ya que es más fácil discutir el instrumento
familiar de los astrónomos modernos) de manera que pueda girar solamente sobre un eje
fijo apuntando hacia el este y el oeste; el resultado es que el telescopio puede solamente
* Hiparco de Nicea (190 a. C. - 120 a. C.). Astrónomo, matemático y geógrafo griego. Nota del Traductor.
101
apuntar al sur, con una mayor o menor elevación de dirección, o, si se gira más allá de
la cima, puede apuntar hacia el norte. Este es el instrumento de tránsito, el gran
instrumento para la medición exacta de los tiempos en los que las estrellas se deben al
sur o se deben al norte. Pero, de manera indirecta, este instrumento mide ángulos.
Porque cuando se ha observado el tiempo transcurrido entre los tránsitos de dos
estrellas, por la suposición de la rotación uniforme de la Tierra, obtenemos el ángulo a
través del cual la Tierra ha girado en ese periodo de tiempo. El ángulo entre dos
estrellas puede ser directamente medido usando otros instrumentos.
Porque si E es el ojo del astrónomo, y EA y EB son las direcciones en las que las
estrellas son observadas, es fácil desarrollar los instrumentos necesarios para medir el
ángulo AEB. Por lo tanto, cuando el astrónomo está estudiando los cielos, en realidad
está midiendo ángulos para fijar las direcciones relativas de las estrellas y planetas en
cada instante. De nuevo, en el problema análogo de la agrimensura*, los ángulos son el
tema principal de las mediciones. Al medir la longitud, es muy probable que no se haga
con exactitud; ríos, casas, bosques, montañas e irregularidades del suelo en general se
suelen entrometer en la medición. La medición completa de un país dependerá
solamente de una o dos mediciones de longitud directas, hechas con sumo cuidado en
* Medición de superficies y áreas terrestres. Nota del Traductor.
102
lugares selectos como la llanura de Salisbury*. La principal tarea de un reconocimiento
de este tipo es la medición de ángulos.
Por ejemplo, A, B, y C serán puntos cumbre en cualquier distrito estudiado, digamos
que son la parte superior de las torres de las iglesias. Estos puntos son visibles cada uno
desde los otros. Entonces, es sumamente sencillo, desde A, medir el ángulo BAC, desde
B, medir el ángulo ABC, y desde C, medir el ángulo BCA. Teóricamente, solamente es
necesario medir dos de estos ángulos; porque, debido a una célebre proposición
geométrica, la suma de los tres ángulos de un triángulo equivale a dos ángulos rectos, de
manera que cuando dos de los ángulos son conocidos, el tercero puede ser deducido. Es
mejor, sin embargo, medir en la práctica a los tres, para que cualquier pequeño error de
observación pueda ser controlado. En el proceso de elaboración de mapas de un país, se
utilizan los triángulos de esta manera. Este proceso es llamado triangulación, y es el
proceso fundamental de un estudio de este tipo.
Ahora bien, cuando todos los ángulos del triángulo son conocidos, la forma del
triángulo también lo es, esto es, la forma como distinguida del tamaño. Hemos llegado
al gran principio de la similitud geométrica. La idea es muy familiar a nosotros en sus
aplicaciones prácticas. Todos tenemos una idea de un plano dibujado a escala. Así, si la
* La llanura de Salisbury es una meseta rocosa que se encuentra en la parte central del sur de Inglaterra. Nota del Traductor.
103
escala de un plano es de una pulgada a una yarda, una longitud de tres pulgadas en el
plano significa una longitud de tres yardas en el original. También las formas
representadas en el plano son las formas del original, de manera que un ángulo recto en
el original aparece como un ángulo recto en el plano. De manera similar en un mapa,
que es solamente un plano de un país, las proporciones de las longitudes en el mapa son
las proporciones de las distancias entre los lugares indicados, y las direcciones en el
mapa son las direcciones en el país. Por ejemplo, si en el mapa un lugar está hacia el
norte-noroeste de otro lugar, así es en la realidad; dicho de otro modo, en un mapa los
ángulos son los mismos que en la realidad.
La similitud geométrica puede ser definida como sigue: dos figuras son similares
si (i) a cualquier punto de una figura corresponde un punto en la otra figura, de modo
que para cada línea haya una línea correspondiente, y a cada ángulo un ángulo
correspondiente, y (ii) las longitudes de las líneas correspondientes están en una
proporción fija, y las magnitudes de los ángulos correspondientes son las mismas. La
proporción fija de las longitudes de líneas correspondientes en un mapa (o plano) y en el
original es llamada la escala de un mapa. La escala debe indicarse siempre en el margen
de cualquier mapa o plano. Ya se ha dicho que dos triángulos cuyos ángulos son
respectivamente iguales son similares.
De esta forma, si los dos triángulos ABC y DEF tienen ángulos iguales en A y en D, y
en B y en E, y en C y en F, entonces DE es a AB en la misma proporción que EF es a
104
BC y que FD es a CA. Sin embargo, no es verdad que otras figuras tengan
necesariamente similitud por el simple hecho de la igualdad de sus ángulos. Tomemos,
por ejemplo, los casos de un rectángulo y de un cuadrado.
Sea ABCD un cuadrado, y ABEF un rectángulo. Mientras que el lado AB del cuadrado
es igual al lado AB del rectángulo, el lado BC del cuadrado es aproximadamente la
mitad del lado BE del rectángulo. Por lo tanto, no es verdad que el cuadrado ABCD sea
similar al rectángulo ABEF. Esta propiedad particular del triángulo, que no es
compartida por otras figuras rectilíneas, hace que sea la figura fundamental en la teoría
de la similitud. Por consiguiente, la triangulación es el proceso fundamental para las
mediciones de tierra. La palabra “trigonometría” se deriva de dos palabras griegas,
trigonon, triángulo, y metria, medida. La cuestión fundamental por la que surgió la
trigonometría es esta: dadas las magnitudes de los ángulos de un triángulo, qué se puede
afirmar sobre las magnitudes relativas de los lados. Nótese que decimos “magnitudes
relativas de los lados” porque en la teoría de la similitud solamente se conocen las
proporciones de los lados. Para responder a esta cuestión, deben ser introducidas ciertas
funciones de las magnitudes de un ángulo, considerado como el argumento. En su
origen, estas funciones fueron obtenidas al considerar un triángulo con ángulos rectos, y
la magnitud del ángulo era definida por la longitud del arco de un círculo. En los libros
modernos de matemáticas elementales, la posición fundamental del arco del círculo que
define la magnitud del ángulo ha sido relegada a un segundo plano, sin haber
105
conseguido con esto avances teóricos o pedagógicos significativos. Primero, debe ser
notado que, en relación con la similitud, el círculo tiene la misma posición fundamental
entre las figuras curvilíneas que el triángulo entre las rectilíneas. Cualesquiera dos
círculos son figuras similares; solamente difieren en su escala. Las longitudes de las
circunferencias de dos círculos, tales como APA’ y A1P1A1’ en la Fig. 26, están en
proporción con las longitudes de sus radios. Además, si los dos círculos tienen el mismo
centro 0, como lo tienen los dos círculos de la Fig. 26, entonces los arcos AP y A1P1,
interceptados por cualquier ángulo A0P, están también en proporción a sus radios.
Por lo tanto, la proporción de la longitud del arco AP a la longitud del radio 0P, esto es
Pradio
arcoAP
0, es un número completamente independiente de la longitud 0P, y es el mismo
que la fracción1
11
0Pradio
ParcoA. Esta fracción de “arco dividido por radio” representa el
camino teórico adecuado para medir la magnitud de un ángulo, ya que no depende de
ninguna unidad arbitraria de longitud, ni de ninguna forma arbitraria de dividir
cualquier ángulo asumido, tal como puede ser un ángulo recto. De esta forma, la
fracción A
AP
0 representa la magnitud del ángulo A0P. Ahora tracemos PM
perpendicularmente a 0A. Los matemáticos griegos llamaron a la línea PM el seno del
106
arco AP, y a la línea 0M el coseno del arco AP. Eran muy conscientes de que la
importancia de las relaciones de estas distintas líneas entre sí dependía de la teoría de
similitud que hemos expuesto. Pero sus definiciones no expresaban las propiedades que
surgen de esta teoría. Tampoco tenían presentes las ideas generales modernas con
respecto a las funciones como pares correlacionados de números variables, ni cualquier
concepción moderna del álgebra y del análisis algebraico. Por consiguiente, era natural
en ellos pensar simplemente en las relaciones entre ciertas líneas en un diagrama. Para
nosotros el caso es distinto: deseamos incorporar nuestras más poderosas ideas.
Por lo tanto, en las matemáticas modernas, en lugar de considerar al arco AP,
consideramos la fracción P
AP
0, que es un número igual para todas las longitudes de 0P;
y, en lugar de considerar a las líneas PM y 0M, consideramos las fracciones P
PM
0 y
P
M
0
0 que, de nuevo, son números no dependientes de la longitud de 0P, es decir, no
dependientes de la escala de nuestros diagramas. Entonces definimos al número P
PM
0
como el seno del número P
PA
0, y al número
P
M
0
0 como el coseno del número
P
M
0
0.
Estas formas fraccionales son toscas para imprimir*, así que pongamos u para la
fracción P
AP
0, que representa la magnitud del ángulo A0P, y v para la fracción
P
PM
0, y
w para la fracción P
M
0
0. Entonces u, v, y w son números y, como estamos hablando de
cualquier ángulo A0P, son números variables. Pero existe una correlación entre sus
magnitudes, de tal forma que cuando u (es decir, el ángulo A0P) está dada, las
magnitudes de v y w están definitivamente determinadas. Por lo tanto, v y w son
funciones del argumento u. Hemos llamado a v el seno de u, y a w el coseno de u.
Queremos ahora adaptar la notación funcional general y=f(x) a estos casos especiales:
así que, en las matemáticas modernas, escribimos “sen” para “f” cuando queremos
indicar la función especial de “seno”, y “cos” para “f” cuando queremos indicar la
función especial de “coseno”. Así, con los significados de arriba para u, v, y w,
obtenemos
v=sen u, y w=cos u, * Este libro está escrito en 1910. Nota del Traductor.
107
donde los paréntesis que suelen rodear a x en f(x) son omitidos para las funciones
especiales. El significado de estas funciones sen y cos como correlacionando los pares
de números u y v, y u y w, es que las relaciones funcionales deben ser encontradas al
construir (Cf. Fig. 26) un ángulo A0P, cuya medida “AP dividido por 0P” sea igual a u,
y que entonces v sea el número dado por “PM dividido por 0P”, y w sea el número dado
por “0M dividido por 0P”.
Es evidente que sin más definiciones, tendríamos dificultades cuando el número
u sea demasiado grande, porque entonces el arco AP puede ser mayor que una cuarta
parte de la circunferencia del círculo, y el punto M (Cf. Fig. 26) podría estar entre 0 y
A’, y no entre 0 y A. También P podría estar por debajo de la línea A0A’, y no sobre
ella, como en la Fig. 26. A fin de que evitemos esta dificultad, podemos recurrir a las
ideas y convenciones de la geometría de coordenadas para definir al seno y al coseno.
Dejemos que la parte 0A del ángulo sea el eje 0X, y que se produzca al eje hacia atrás
para obtener su parte negativa 0X’. Tracemos el otro eje Y0Y’ perpendicular a él.
Dejemos que cualquier punto P a una distancia r desde 0 tenga coordenadas x e y. Estas
coordenadas son ambas positivas en el primer “cuadrante” del plano, por ejemplo, las
coordenadas x e y de P en la Fig. 27.
En los otros cuadrantes, o una o ambas de las coordenadas son negativas, por ejemplo,
x’ e y para P’, y x’ e y’ para P’’, y x e y’’ para P’’’ en la Fig. 27, donde x’ e y’ son ambas
108
números negativos. El ángulo positivo P0A es el arco AP dividido por r, su seno es r
y y
su coseno es r
x; el ángulo positivo P’0A es el arco ABP’ dividido por r, su seno es
r
y y
su coseno es r
x'; el ángulo positivo P’’0A es el arco ABA’P’’ dividido por r, su seno es
r
y', y su coseno es
r
x'; y el ángulo positivo P’’’0A es el arco ABA’B’P’’’ dividido por
r, su seno es r
y' y su coseno es
r
x.
Pero, incluso ahora, no hemos ido lo suficientemente lejos.
Porque supongamos que escogemos que u sea un número mayor que la proporción de
toda la circunferencia del círculo a su radio. Debido a la similitud de todos los círculos,
esta proporción es la misma para todos los círculos. Esto siempre se denota en las
matemáticas con el símbolo 2π, donde π es la forma griega de la letra p, y su nombre en
el alfabeto griego es “pi”. Se puede probar que π es un número inconmensurable, y que,
por lo tanto, su valor no puede ser expresado por ninguna fracción, ni por ninguna
terminación o decimal periódico. Su valor para pocos lugares decimales es 3.14159;
para muchos propósitos, una aproximación lo suficientemente exacta es 7
22. Los
matemáticos pueden fácilmente calcular el valor de π a cualquier grado de exactitud
requerida, así como pueden calcular 2 . A su valor se le han dado hasta 707 lugares
decimales. Tal cálculo, no obstante, es simplemente una curiosidad, y carece de interés
práctico o teórico. La determinación exacta de π es sólo una de las dos partes del
famoso problema de la cuadratura del círculo. La otra parte del problema es, a partir de
los métodos teóricos de la geometría pura, describir una línea recta que sea igual en
longitud a la circunferencia. Se sabe que las dos partes del problema son imposibles de
resolver; y este insoluble problema ha perdido todo interés práctico o teórico, y ha sido
absorbido en ideas más amplias.
Después de esta divagación sobre el valor de π, regresamos ahora a la cuestión
de la definición general de la magnitud de un ángulo, para poder ser capaces de producir
un ángulo correspondiente a cualquier valor u. Supongamos un punto que se mueve, Q,
empezando desde A en 0X (Cf. Fig. 27), y que rota en la dirección positiva (dirección
contraria al movimiento de las manecillas del reloj en la figura considerada) alrededor
de la circunferencia del círculo por cualquier número de veces, descansando finalmente
109
en cualquier punto, por ejemplo, en P, P’, P’’, o P’’’. Entonces, la longitud total del
camino curvilíneo circular recorrido, dividida por el radio del círculo, r, es la definición
generalizada de un ángulo positivo de cualquier tamaño. Dejemos que x, y sean las
coordenadas del punto en el que el punto Q descansa, es decir, en una de las cuatro
posiciones alternativas mencionadas en la Fig. 27; x e y (como se usan aquí), serán o x e
y, o x’ e y, o x’ e y’, o x e y’’. Entonces el signo de este ángulo generalizado es r
y , y su
coseno es r
x. Con estas definiciones, las relaciones funcionales v=sen u y w=cos u,
están finalmente definidas para todos los valores reales positivos de u. Para los valores
negativos de u, simplemente tomamos la rotación de Q en el sentido opuesto (en
dirección a las manecillas del reloj); pero no merece la pena seguir insistiendo sobre
este punto, ahora que ya hemos explicado el método general de proceder.
Estas funciones de seno y coseno, así definidas, nos permiten enfrentarnos a los
problemas concernientes al triángulo desde el cual la trigonometría surge. Pero ahora
estamos en posición de relacionar la trigonometría con la más extensa idea de
periodicidad, sobre la cual ya hablamos en el último capítulo. Es fácil observar que las
funciones sen u y cos u son funciones periódicas de u. Porque, consideremos la
posición, P, (en la Fig. 27) de un punto en movimiento, Q, que ha empezado en A y ha
girado alrededor del círculo. Esta posición, P, marca los ángulos r
arcoAP, y 2 π +
r
arcoAP, y 4 π +
r
arcoAP, y 6 π +
r
arcoAP, y así indefinidamente. Ahora, todos estos
ángulos tienen el mismo seno y coseno, a saber, r
y y
r
x. Por lo tanto, es fácil ver que, si
se escoge cualquier valor para u, los argumentos u, 2 π + u, y 4 π + u, y 6 π + u, y 8 π +
u, y así indefinidamente, tienen todos los mismos valores para los senos y cosenos
correspondientes. En otras palabras,
sen u = sen(2 π + u) = sen(4 π + u) = sen (6 π + u) = etc.;
cos u = cos(2 π + u) = cos (4 π + u) = cos(6 π + u) = etc.
Este hecho es expresado al decir que sen u y cos u son funciones periódicas con periodo
igual a 2 π.
La gráfica de la función y = sen x (nótese que ahora hemos abandonado v y u por
las más familiares y y x), se muestra en la Fig. 28. Tomamos para el eje de x cualquier
longitud arbitraria para representar al número π, y en el eje de y cualquier longitud
110
arbitraria para representar al número 1. Los valores numéricos del seno y del coseno no
pueden nunca exceder la unidad. La recurrencia de la figura después de los períodos de
2 π es notable. Esta gráfica representa el estilo más sencillo de función periódica, y
desde la cual todas las demás son construidas. El coseno no ofrece nada
fundamentalmente diferente al seno. Así, es fácil probar que cos x = sen
+2
πx ; se
puede observar, entonces, que la gráfica de cos x es simplemente la Fig. 28 modificada
al trazar el eje de 0Y a lo largo del punto en 0X marcado como 2
π, en lugar de trazarlo
en su posición actual en la figura.
Es fácil construir una función de “seno” en la cual el periodo tenga cualquier valor
asignado a, porque solamente tenemos que escribir
y = sen a
xπ2,
y después
sena
ax )(2 +π = sen
+ ππ
22
a
x = sen
a
xπ2.
Así, el periodo de esta nueva función es ahora a. Demos ahora una definición general de
lo que queremos decir cuando hablamos de una función periódica. La función f(x) es
periódica, con el periodo a, si (i) para cualquier valor de x tenemos f(x) = f(x+a), y (ii)
no hay un número b menor que a tal que para cualquier valor de x, f(x) = f(x+b).
111
La segunda cláusula se pone en la definición porque cuando tenemos sena
xπ2,
no es solamente periódica en el periodo a, sino también en los periodos 2a, 3a, etc.; esto
surge porque
sena
ax )3(2 +π = sen
+ ππ6
2
a
x = sen
a
xπ2.
Así que es el periodo más pequeño del que queremos depender y es el periodo de la
función. La mayor parte de la teoría abstracta de las funciones periódicas y de todas las
aplicaciones de la teoría a la ciencia física, están dominadas por un importante teorema
llamado el teorema de FOURIER; a saber, que si f(x) es una función periódica con el
periodo a y si f(x) también satisface ciertas condiciones, que prácticamente están
siempre presupuestas en las funciones sugeridas por los fenómenos naturales, entonces
f(x) puede ser escrita como la suma de un conjunto de términos en la forma
c0+c1sen
+ 1
2e
a
xπ+c2sen
+ 2
4e
a
xπ+c3sen
+ 3
6e
a
xπ+ etc.
En esta fórmula, c0, c1, c2, c3, etc., y también e1, e2, e3, etc., son constantes, escogidas así
para ajustarse a la función particular. De nuevo tenemos que preguntarnos, ¿cuántos
términos deben ser escogidos? Y aquí surge una nueva dificultad: porque podemos
probar que, aunque para algunos casos particulares un número definido bastará, en
general, todo lo que podemos hacer es aproximarnos tan cerca como queramos al valor
de la función al escoger más y más términos. Este proceso de aproximación gradual nos
lleva a la consideración de la teoría de las series infinitas, una parte esencial de la teoría
matemática que será considerada en el siguiente capítulo.
El método mostrado arriba consistente en expresar una función periódica como
una suma de senos es llamado el “análisis armónico” de la función. Por ejemplo, en
cualquier punto de la costa del mar, las mareas suben y bajan periódicamente. Así, en un
punto cerca del Estrecho de Dover habrá dos mareas diarias debidas a la rotación de la
Tierra. La subida y la bajada diarias de las mareas son complicadas por el hecho de que
hay dos maremotos, uno viniendo del Canal Inglés, y otro que se ha extendido alrededor
del norte de Escocia, y ha venido hacia el sur bajando por el Mar del Norte. De nuevo,
algunas mareas altas son más altas que otras: esto se debe al hecho de que el Sol genera
una influencia sobre las mareas, así como lo hace la Luna. En este sentido, se introducen
los periodos mensuales y otro tipo de periodos. Dejamos sin tomar en cuenta la
importante influencia de los vientos, que no puede ser prevista. El problema general del
112
análisis armónico de las mareas es encontrar conjuntos de términos, como aquellos
usados unas pocas líneas arriba, de tal forma que cada conjunto muestre - de manera
aproximadamente cierta - la contribución de las influencias que generan las mareas de
un “periodo” a la altura de la marea en cualquier instante. El argumento x será, por lo
tanto, el tiempo contado desde cualquier comienzo que se considere conveniente.
De nuevo, el movimiento de vibración de una cuerda de violín está sujeto a un
análisis armónico similar, y también lo están las vibraciones del éter y del aire,
correspondientes a ondas de luz y a ondas de sonido, respectivamente. Estamos aquí
ante la presencia de uno de los procesos fundamentales de la física matemática, a saber,
el método general de tratar con el gran hecho natural de la periodicidad.
113
CAPÍTULO XIV
SERIES
Ninguna parte de las matemáticas sufre más de la trivialidad de su presentación
inicial a los principiantes que el tema de las series. Son considerados dos ejemplos
menores de las series, a saber, las series aritmética y geométrica; estos ejemplos son
importantes porque son los más simples dentro de la teoría general. Pero las ideas
generales nunca son reveladas y, de esta forma, los ejemplos, que no consiguen
ejemplificar nada, son reducidos a trivialidades absurdas.
La idea matemática general de una serie es la de un conjunto de cosas arreglada
en orden, esto es, en una secuencia. Este significado está exactamente representado en el
uso común del término. Consideremos, por ejemplo, la serie de los Primeros Ministros
ingleses durante el siglo diecinueve, arreglada en el orden del primer ocupante de esa
oficina en el siglo. La serie comienza con William Pitt, y termina con Lord Rosebery
quien, curiosamente, es el biógrafo del primer miembro. Pudimos haber considerado
otro orden serial para el arreglo de estos hombres, por ejemplo, de acuerdo con su
estatura, o con su peso. Estos otros órdenes sugeridos parecen ser triviales en conexión
con los Primeros Ministros, y no se encuentran de manera natural en la mente; pero,
abstractamente, son tan buenos órdenes como cualesquiera otros. Cuando un orden entre
los términos es mucho más importante o más obvio que los otros órdenes, se dice que es
el orden de aquellos términos. Así, el orden de los números enteros será siempre
entendido como un orden arreglado de acuerdo con la magnitud, aunque haya un
número indefinido de maneras de arreglarlos. Cuando el número de cosas consideradas
es finito, el número de maneras o formas de arreglar estas cosas en orden es llamado el
número de sus permutaciones. El número de permutaciones de un conjunto de n cosas,
donde n es algún entero finito, es
n× (n 1− ) 1234...)3()2( ×××××−×−× nn
esto es, es el producto de los primeros enteros n; este producto es tan importante en las
matemáticas, que se usa un símbolo especial para representarlo, y es siempre escrito
como “n!”. Así, 2! = 2 1× = 2, y 3! = 3 12×× = 6, y 4! = 4 123 ××× = 24, y 5! =
5 1234 ×××× = 120. Mientras n incrementa, el valor de n! incrementa muy rápido; de
esta forma, 100! es cien veces la longitud de 99!.
114
Es fácil constatar que, en el caso de los valores pequeños de n, n! es el número
de formas de arreglar n cosas en orden. Consideremos dos cosas a y b; éstas se pueden
arreglar en dos órdenes, ab y ba, y 2! = 2. De nuevo, tomemos tres cosas, a, b, y c; éstas
se pueden arreglar en seis órdenes, abc, acb, bac, bca, cab, y cba, y 3! = 6. De manera
similar sucede con los veinticuatro órdenes en las que cuatro cosas, a, b, c, y d, pueden
ser arregladas.
Cuando llegamos a los conjuntos infinitos de cosas - como los conjuntos de
todos los enteros, o todas las fracciones, o todos los números reales -, llegamos a las
complicaciones de la teoría de los tipos de orden. Este tema fue tratado en el capítulo VI
cuando consideramos los posibles órdenes de los enteros, de las fracciones, y de los
números reales. Toda la cuestión de los tipos de orden constituye una nueva rama de las
matemáticas de gran importancia. No vamos a considerarla más allá. Todas las series
infinitas que consideraremos ahora son del mismo tipo de orden que el de los enteros
arreglados en orden ascendente de acuerdo con su magnitud, esto es, con un primer
término, y de manera tal que cada término tenga una pareja de vecinos, uno de cada
lado, con la excepción del primer término que tiene, obviamente, solamente un vecino.
De esta forma, si m es cualquier entero (que no sea cero), habrá siempre un término a la
m. Una serie con un número finito de términos (digamos, n términos), tiene las mismas
características que las series infinitas en lo que a vecinos puestos unos junto con otros se
refiere; solamente difiere de las series infinitas en tener un último término, a saber, el
término a la n.
Lo importante a hacer con una serie de números - usando el término “serie” en el
sentido restringido en el que se ha usado - es añadir juntos sus términos sucesivos.
Así, si u1, u2, u3, … , un … son respectivamente el 1er, 2do, 3er, 4to, … , n, …
términos de la serie de números, formamos sucesivamente la series u1, u1 + u2, u1 + u2 +
u3, u1 + u2 + u3 + u4, etc.; así, la suma de los primeros n términos puede ser escrita como
u1 + u2 + u3 + … un
Si la serie tiene solamente un número finito de términos, llegamos por fin de esta
manera a la suma de toda la serie de términos. Pero, si la serie tiene un número infinito
de términos, este proceso de formar sucesivamente las sumas de los términos nunca
termina; y en este sentido, no hay tal cosa como la suma de una serie infinita.
¿Pero por qué es importante añadir de manera sucesiva los términos de una serie
en esta forma? La respuesta es que estamos simbolizando el fundamental proceso
mental de la aproximación. Este es un proceso que tiene una importancia que trasciende
115
las regiones de las matemáticas. Nuestro limitado intelecto no puede lidiar con todo el
complicado material del mundo de una sola vez, y nuestro método de ordenar es aquel
de la aproximación. El estadista, al elaborar un discurso, pone los temas importantes
primero, y los detalles en lugares subordinados. También está el inverso método
artístico que consiste en preparar a la imaginación a partir de la presentación de detalles
subordinados o especiales, y después llegar gradualmente a una crisis. En cualquiera de
los casos, el proceso es el de la adición o suma gradual de efectos; y esto es exactamente
lo que se hace con la suma sucesiva de los términos de una serie. Nuestro método
ordinario de representar a los números es un proceso de adición gradual, al menos para
los casos de los números grandes. Así, 568,213 se presenta en la mente como
500,000 + 60,000 + 8,000 + 200 + 10 + 3.
En el caso de las fracciones decimales, esto es mucho más notorio. Así, 3.14159
es 3 + 100000
9
10000
5
1000
1
100
4
10
1 ++++ .
También, 3 y 3 + 10
1, y 3 +
100
4
10
1 + , y 3 + 1000
1
100
4
10
1 ++ , y 3 +
10000
5
1000
1
100
4
10
1 +++ son aproximaciones sucesivas del resultado completo
3.14159. Si leemos 568,213 al revés, esto es, de derecha a izquierda, empezando con las
3 unidades, lo estamos leyendo en la forma artística, preparando gradualmente a la
mente para la crisis de 500,000.
El proceso ordinario de la multiplicación numérica sucede por medio de la
adición de una serie.
Consideremos el cálculo
342
658
2736
1710
2052
225036
116
Por consiguiente, las tres líneas a ser añadidas forman una serie de la cual el primer
término es la línea superior. Esta serie sigue el método artístico de presentar el término
más importante al final, y no por algún sentimiento artístico, sino por la conveniencia
obtenida al mantener un control firme sobre el lugar de la unidad, permitiéndonos omitir
algunos 0s, formalmente necesarios.
Pero cuando nos aproximamos a algo al añadir gradualmente los términos
sucesivos de una serie infinita, ¿a qué nos estamos aproximando? La dificultad es que la
serie no tiene una “suma” en el sentido estricto de la palabra, porque la operación de
añadir conjuntamente sus términos nunca puede ser completada. La respuesta es que nos
estamos aproximando al límite de la suma de la serie, y debemos ahora proceder a
explicar qué es el “límite” de una serie.
La suma de una serie se aproxima a un límite cuando la suma de cualquier
número de sus términos, siempre que el número sea lo suficientemente grande, es
cercana al límite al que se pretende aproximar. Pero esta descripción del significado de
“aproximarse a un límite” no puede soportar el escrutinio de las matemáticas modernas.
¿Qué se quiere decir con lo suficientemente grande, y con cercano al límite, y con
pretender aproximarse? Todas estas frases imprecisas deben ser explicadas en términos
de las simples ideas abstractas que son admitidas en las matemáticas puras.
Dejemos que los términos sucesivos de la serie sean u1, u2, u3, u4, …, un, etc., de
tal forma que un es el término a la n de la serie. También, dejemos que sn sea la suma de
los primeros n términos, sea lo que sea n, de modo que
s1 = u1, s2 = u1 + u2, s3 = u1 + u2 + u3, y sn = u1 + u2 + u3 + … +un.
Entonces, los términos s1, s2, s3, … sn, … forman una nueva serie, y la formación
de esta serie es el proceso de adición de la serie original. La “aproximación” de la
adición o suma de la serie original a un “límite” significa “la aproximación de los
términos de esta nueva serie a un límite”. Y tenemos ahora que explicar qué queremos
decir con la aproximación a un límite de los términos de la serie.
Ahora bien, recordando la definición (dada en el capítulo XII) de un estándar de
aproximación, la idea del límite significa esto: l es el límite de los términos de la serie
s1, s2, s3, … sn, …, si, correspondiendo a cada número real k, tomada como el estándar
de aproximación, puede ser encontrado un término sn de la serie de modo que todos los
términos sucesivos (es decir, sn+1, sn+2, etc.) se aproximen a l dentro de ese estándar de
aproximación. Si se escoge otro estándar k1 más pequeño, el término sn puede estar muy
117
pronto en la serie, y un término posterior sm, con las propiedades de arriba, será
encontrado.
Si esta propiedad se mantiene, es evidente que mientras se recorre la serie s1, s2,
s3, …, sn, … de izquierda a derecha, después de un tiempo llegaremos a términos todos
de los cuales son más cercanos a l que cualquier número que se quiera asignar. En otras
palabras, se puede aproximar a l tanto como se quiera. La íntima conexión de esta
definición del límite de una serie con la definición de una función continua dada en el
capítulo XI se percibe de inmediato.
Volviendo a la serie original u1, u2, u3, …, un, …, el límite de los términos de la
serie s1, s2, s3, …, sn, …, es llamado “la suma al infinito” de la serie original. Pero es
evidente que este uso de la palabra “suma” es muy artificial, y no debemos asumir las
propiedades análogas a aquellas de la suma ordinaria de un número finito de términos
sin antes hacer una investigación especial.
Consideremos un ejemplo de una “suma al infinito”. Pensemos en el decimal
periódico .1111…. Este decimal es simplemente la forma de simbolizar la “suma al
infinito” de la serie .1, .01, .001, .0001, etc. La serie correspondiente encontrada por la
suma es s1 = .1, s2 = .11, s3 = .111, s4 = .1111, etc. El límite de los términos de esta serie
es 9
1; esto es fácil de ver por simple división, ya que
.9000
1111.
900
111.
90
11.
9
1etc=+=+=+=
Por lo tanto, si 17
3 es dada (k de la definición), .1 y todos los términos sucesivos
defieren de 9
1 por menos de
17
3; si
1000
1 es dada (otra opción para k de la definición),
.111 y todos los términos sucesivos difieren de 9
1 por menos de
1000
1; etc., cualquiera
sea la opción escogida para k.
Es evidente que nada de lo que se ha dicho da la menor idea de cómo la “suma al
infinito” de una serie debe ser encontrada. Simplemente hemos indicado las condiciones
que tal número debe satisfacer. De hecho, un método general para encontrar, en todos
los casos, la suma al infinito de una serie, no sería posible en modo alguno, por la
simple razón de que tal “suma”, como ha sido definida aquí, no siempre existe. las
series que poseen una suma al infinito son llamadas convergentes, y aquellas que no lo
poseen son llamadas divergentes.
118
Un ejemplo obvio de una serie divergente es 1, 2, 3, …, n, …, es decir, la serie
de los enteros de acuerdo con su orden de magnitud. Porque, cualquier número l que
queramos asignar como su suma al infinito, y cualquier estándar de aproximación k que
escojamos, al tomar los suficientes términos de la serie, siempre se puede conseguir que
la suma difiera de l por más que k. Otro ejemplo de una serie divergente es 1, 1, 1, etc.,
esto es, la serie en la que cada término es igual a 1. Porque entonces la suma de n
términos es n, y esta suma crece sin límite mientras n se incrementa. De nuevo, otro
ejemplo de una serie divergente es 1, 1− , 1, 1− , 1, 1− , etc., es decir, la serie en la que
los términos son alternativamente 1 y 1− . La suma de un número impar de términos es
1, y la de un número par de términos es 0. Por lo tanto, los términos de la serie s1, s2, s3,
…, sn, … no se aproximan a un límite, aún cuando no se incrementen sin límite.
Es tentador suponer que la condición para que u1, u2, … un, … tenga una suma al
infinito sea que un disminuya indefinidamente mientras n aumenta. Si este fuera el caso,
las matemáticas serían una ciencia mucho más fácil de lo que son. Desafortunadamente,
la suposición no es verdadera.
Por ejemplo, la serie
1, ,...1
,...,4
1,
3
1,
2
1
n
es divergente, y es fácil ver que este es el caso. Consideremos la suma de n términos
empezando en el término (n+1). Estos n términos son :2
1,...
3
1,
2
1,
1
1
nnnn +++ hay n de
ellos y n2
1 es el último. Por lo tanto, su suma es mayor que n veces
n2
1, es decir, es
mayor que 2
1. Ahora, sin alterar la suma al infinito, si es que existe, podemos añadir
términos vecinos de manera conjunta, y obtener la serie
1, .,,8
1
7
1
6
1
5
1,
4
1
3
1,
2
1etc++++
esto es, por lo que se ha dicho arriba, una serie cuyos términos después del 2do término
sean mayores que aquellos de la serie
1, .,,2
1,
2
1,
2
1etc
donde todos los términos después del 1er término son iguales. Pero esta serie es
divergente. Por consiguiente, la serie original también lo es.
119
Esta cuestión de la divergencia muestra qué tan cuidadosos debemos ser en la
discusión sobre las propiedades de la suma de un número finito de términos en la suma
de una serie infinita. Porque la propiedad más elemental de un número finito de
términos es que éstos poseen una suma, pero incluso esta propiedad fundamental no es
necesariamente poseída por una serie infinita. Esta precaución se limita a afirmar que no
debemos dejarnos engañar por la sugerencia del término técnico “suma de una serie
infinita”. Es común indicar la suma de una serie infinita
u1, u2, u3, …un, …por
u1+u2+u3+…+un+…
Ahora pasamos a la generalización de la idea de una serie, que las matemáticas,
fieles a su método, hacen por medio de la variable. Hasta ahora, solamente hemos
contemplado series en las que cada término definido era un número definido. Pero
igualmente bien, podemos generalizar, y hacer que cada término sea alguna expresión
matemática que contenga una variable x. Así, podemos considerar a la serie 1, x, x2, x3,
…, xn, …, y a la serie x, ,...,...,3
,2
32
n
xxx n
. Con el fin de simbolizar la idea general de
cualquier función de este tipo, concibamos una función de x, digamos ƒn(x), que
involucra en su formación una variable entera n, entonces, al dar a n los valores 1, 2, 3,
etc., en sucesión, obtenemos la serie ƒ1(x), ƒ2(x), ƒ3(x), …, ƒn(x),… .
Tal tipo de serie puede ser convergente para algunos valores de x, y divergente para
otros. Es, de hecho, más bien raro encontrar una serie que involucre una variable x que
sea convergente para todos los valores de x - por lo menos, en cualquier caso particular,
es muy arriesgado asumir que este es el caso -. Por ejemplo, examinemos el más simple
de todos los casos, a saber, la serie “geométrica”
1, x, x2, x3, …, xn, … .
La suma de n términos es dada por
sn = 1+x+x2+x3+ … +xn.
Ahora multipliquemos ambos lados por x y obtenemos
xsn = x+x2+x3+x4+ … +xn+xn+1.
Ahora substraemos la última línea de la línea de arriba, y obtenemos
sn(1 x− ) = sn-xsn = 1-xn+1,
y, por lo tanto (si x no es igual a 1),
sn = .11
1
1
1 11
x
x
xx
x nn
−−
−=
−− ++
120
Ahora, si x es numéricamente menor que 1, para valores lo suficientemente grandes de
n, x
xn
−1 será siempre menor que k, sin importar cuál k* escojamos. Así, si x es menor
que 1, la serie 1, x, x2, …xn, … es convergente, y x−1
1 es su límite. Esta declaración se
simboliza como
x−1
1= 1+x+x2+ … +xn+ …, (x<1).
Pero si x es numéricamente mayor que 1, o numéricamente igual a 1, la serie es
divergente. En otras palabras, si x está entre 1− y +1, la serie es convergente; pero si x
es igual a 1− o a +1, o si x está fuera del intervalo 1− a +1, entonces la serie es
divergente. Así, la serie es convergente en todos los “puntos” dentro del intervalo 1− a
+1, excluyendo los puntos finales†.
En este punto de nuestra investigación surge otra cuestión. Supongamos que la
serie
ƒ1(x)+ ƒ2(x)+ ƒ3(x)+ … + ƒn(x)+…
es convergente para todos los valores de x que se encuentran en el intervalo a a b, es
decir, ƒ(x) es convergente para cualquier valor de x que sea mayor que a y menor que b.
También, supongamos que queremos estar seguros de que al aproximarnos al límite
podamos añadir conjuntamente los suficientes términos que resulten aplicables a algún
estándar de aproximación k. ¿Podemos siempre expresar algún número de términos,
digamos n, tales que, si tomamos n o más términos para formar la suma, habremos
satisfecho para cualquier valor que x tenga dentro del intervalo el deseado estándar de
aproximación?
La respuesta es que a veces podemos y a veces no podemos hacer esto para cada
valor de k. Cuando podemos, la serie se llama uniformemente convergente a lo largo del
intervalo, y cuando no podemos, se llama no uniformemente convergente a lo largo del
intervalo. Es una gran diferencia para las propiedades de la serie si es o no
uniformemente convergente a lo largo del intervalo. Ilustremos esto con el ejemplo y
con los números más simples.
Consideremos la serie geométrica
1+x+x2+x3+ … +xn+ … .
* Recordemos que k es el estándar de aproximación. Nota del Traductor. † Es decir, -1 ó +1. Nota del Traductor.
121
Es convergente a lo largo del intervalo 1− a +1, excluyendo los valores finales x = .1±
Pero no es uniformemente convergente a lo largo de este intervalo. Porque si
sn(x) es la suma de n términos, hemos probado que la diferencia entre sn(x) y el límite
x−1
1 es .
1
1
x
xn
−
+
Ahora supongamos que n es cualquier número dado de términos, digamos 20, y dejemos
que k sea cualquier estándar de aproximación asignado, digamos .001. Entonces, al
tomar a x lo suficientemente cerca de +1 o lo suficientemente cerca de 1− , podemos
hacer que el valor numérico de x
x
−1
21
sea mayor que .001. De esta forma, 20 términos no
van a satisfacer cualquier valor de x a lo largo de todo el intervalo, aunque sean más que
suficientes para algunas partes de él.
El mismo razonamiento puede ser aplicado sin importar qué otro número
escojamos en lugar de 20, y sin importar qué estándar de aproximación escojamos en
lugar de .001. Por lo tanto, la serie geométrica 1+x+x2+x3+… +xn+…, no es
uniformemente convergente a lo largo de todo el intervalo de convergencia 1− a +1.
Pero si tomamos cualquier intervalo más pequeño que se encuentre en ambos extremos
dentro del intervalo 1− a +1, la serie geométrica es uniformemente convergente dentro
de él. Por ejemplo, tomemos el intervalo 0 a 10
1. Entonces, cualquier valor para n que
haga que x
xn
−
+
1
1
sea numéricamente menor que k en estos límites para x, también servirá
para todos los valores de x entre estos límites, ya que sucede que x
xn
−
+
1
1
disminuye en
valor numérico mientras x disminuye en valor numérico. Por ejemplo, si k = .001.
Entonces, poniendo x = 10
1, encontramos que:
para n = 1, ...,0111.90
1
10
11
10
1
1
2
1
==−
=−
+
x
xn
para n = 2, ...,00111.900
1
10
11
10
1
1
3
1
==−
=−
+
x
xn
122
para n = 3, ....000111.9000
1
10
11
10
1
1
4
1
==−
=−
+
x
xn
Así, tres términos serán suficientes para todo el intervalo, aunque, por supuesto, para
algunas partes de éste, es más de lo que es necesario. Nótese que, debido a que
1+x+x2+…+xn+…, es convergente (aunque no uniformemente) a lo largo del intervalo
1− a +1, para cada valor de x en el intervalo, algún número de términos n que satisfaga
un deseado estándar de aproximación puede ser encontrado; pero, mientras tomamos a x
cada vez más cerca de cualquiera de los dos valores finales +1 o 1− , tienen que ser
empleados valores de n cada vez más grandes.
Es curioso que esta importante distinción entre convergencia uniforme y no
uniforme fuera descubierta hasta 1847 por STOKES - más tarde, Sir George STOKES -,
y después en 1850, de manera independiente, por SEIDEL, un matemático alemán.
Los puntos críticos, donde viene la convergencia no uniforme, no están
necesariamente en los límites del intervalo a lo largo del cual la convergencia se
mantiene. Esta es una característica especial que pertenece a las series geométricas.
En el caso de la serie geométrica 1+x+x2+…+xn+…, una simple expresión
algebraica x−1
1 puede ser dada para ser el límite en su intervalo de convergencia. Pero
este no es siempre el caso. A menudo, podemos probar que una serie es convergente
dentro de un cierto intervalo, aunque no sepamos nada acerca de su límite excepto que
es el límite de la serie. Pero esta es una muy buena forma de definir una función, a
saber, como el límite de una serie convergente infinita, y es, de hecho, la forma en la
que la mayoría de las funciones son, o por lo menos, debería, ser definidas.
De esta manera, la serie más importante en el análisis elemental, es
1+x+ ...,!
...!3!2
32
++++n
xxx n
donde n! tiene el significado que le otorgamos anteriormente en este capítulo. Se puede
probar que esta serie es convergente para todos los valores de x, y que es uniformemente
convergente dentro de cualquier intervalo que escojamos. Por lo tanto, tiene todas las
propiedades matemáticas suficientes que una serie puede tener, y es llamada la serie
exponencial. Su suma al infinito se denota como expx. Así, por definición tenemos
123
expx = 1+x+ ...,!
...!3!2
32
++++n
xxx n
donde a expx se le llama la función exponencial.
Es sumamente fácil probar, incluso con un conocimiento escaso de matemáticas
elementales, que (expx)× (expy) = exp(x+y)…(A). En otras palabras, que
(expx)× (expy) = 1+(x+y)+( ) ( ) ( )
....!
...!3!2
32
+++++++n
yxyxyx n
Esta propiedad (A), es un ejemplo de lo que se llama teorema de adición.
Cuando cualquier función [digamos, ƒ(x)] ha sido definida, lo primero que se tiene que
hacer es tratar de expresar ƒ(x+y) en términos de funciones conocidas de x solamente, y
en funciones conocidas de y solamente. Si podemos lograr esto, el resultado se llama
teorema de adición. Los teoremas de adición desempeñan un papel muy importante en
el análisis matemático. Así, el teorema de adición para el seno es dado por
sen(x+y) = sen x cos y + cos x sen y,
y para el coseno por
cos(x+y) = cos x cos y sen− x sen y.
En realidad, las mejores formas de definir sen x y cos x no son a partir de los
elaborados métodos geométricos del capítulo previo, sino como los límites respectivos
de las series
−x ....,!7!5!3
753
etcxxx +−+
y
....,!6!4!2
1642
etcxxx +−+−
de manera que ponemos
sen x = ....,!7!5!3
753
etcxxx
x +−+−
cos x = .....!6!4!2
1642
etcxxx +−+−
124
Estas definiciones son equivalentes a las definiciones geométricas, y ambas
series pueden ser probadas como convergentes para todos los valores de x, y
uniformemente convergentes a lo largo de cualquier intervalo. Estas series de seno y
coseno tienen un parecido general con la serie exponencial de arriba. De hecho, aquellas
están íntimamente conectadas con ésta por medio de la teoría de los números
imaginarios explicada en los capítulos VII y VIII.
La gráfica de la función exponencial se encuentra en la Fig. 29. Corta al eje 0Y
en el punto y = 1, como evidentemente debe hacerlo, porque cuando x = 0, cada término
de la serie, excepto el primero, es 0. La importancia de la función exponencial es que
representa cualquier cantidad física cambiante cuya tasa de aumento en cualquier
instante sea un porcentaje uniforme de su valor en ese instante. Por ejemplo, la gráfica
de arriba representa el tamaño de una población, en cualquier momento, con una tasa de
nacimiento uniforme, donde x corresponde al tiempo considerado desde cualquier día, e
y representa la población de la escala apropiada. La escala debe ser tal, que 0A
represente la población en la fecha que sea tomada como el origen. Hemos llegado
ahora a la idea de “tasas de crecimiento”, que es el tema de nuestro siguiente capítulo.
Una función importante, y que guarda una cercana relación con la función
exponencial, se encuentra al poner 2x− por x como el argumento en la función
125
exponencial. Entonces tenemos exp. (2x− ). La gráfica y = exp. ( 2x− ) se encuentra en
la figura 30.
La curva, que es algo parecido a un sombrero, es llamada la curva del error
normal. Su función correspondiente es sumamente importante para la teoría estadística,
y nos dice, en muchos casos, cuál es el tipo de desviaciones de los resultados promedios
que debemos esperar.
Otra función importante se encuentra al combinar la función exponencial con el
seno, de esta forma:
126
p
xsencxy
π2)exp( ×−=
Esta gráfica se muestra en la figura 31. Los puntos A, B, 0, C, D, E, F, son
puestos en intervalos iguales a ,2
1p y se debe trazar una serie sin final de ellos, tanto
hacia delante como hacia atrás. Esta función representa la “agonía” de las vibraciones
bajo la influencia de la fricción o de fuerzas de “amortiguación”. Aparte de la fricción,
las vibraciones serían periódicas, con un periodo p; pero la influencia de la fricción hace
que la extensión de cada vibración sea más pequeña que la de su predecesora, por un
porcentaje constante de esa extensión. Esta combinación de las ideas de “periodicidad”
(que requiere al seno o al coseno para ser simbolizada), y de “porcentaje constante”
(que requiere a la función exponencial para ser simbolizada), es la razón para la
formación de esta función, a saber, su formación es el producto de una función de seno
en una función exponencial.
127
CAPÍTULO XV
CÁLCULO DIFERENCIAL
La invención del cálculo diferencial marca una crisis en la historia de las
matemáticas. El progreso de la ciencia se divide en periodos caracterizados por una
lenta acumulación de ideas y en periodos en donde, debido al nuevo material para el
pensamiento obtenido pacientemente, algún genio - gracias a la invención de algún
método nuevo o de algún punto de vista novedoso -, repentinamente transforma
cualquier tema y lo lleva a un siguiente nivel. Estos periodos en contraste en el progreso
de la historia del pensamiento son comparados por Shelley con la formación de una
avalancha.
¡El Sol despierta una avalancha!, cuya masa,
Tres veces cernida por la tormenta, ha reunido ahí
Copo tras copo, - en el cielo - mentes desafiantes
Mientras pensamiento tras pensamiento se amontona,
Hasta que una gran verdad es desatada,
Y las naciones se hacen eco de ella*
La comparación, no obstante, puede soportar algunas críticas. La explosión final de la
luz del Sol que despierta la avalancha no está necesariamente más allá de toda
comparación - en cuanto a magnitud se refiere -, con los otros poderes de la naturaleza
que han presidido su lenta formación. Lo mismo es verdad en la ciencia. El genio que
tiene la fortuna de producir la idea final que transforma una región entera del
pensamiento, no necesariamente supera a todos los predecesores que han trabajado en la
formación preliminar de las ideas. Al considerar la historia de la ciencia, es ridículo e
ingrato limitar nuestra admiración a aquellos hombres que han hecho los avances finales
en alguna época.
En el caso particular que ahora nos ocupa, a saber, el cálculo, el tema tuvo una
larga historia antes de adoptar su forma final de las manos de sus dos inventores.
* Traducción mía. Nota del Traductor.
128
Existen algunos rastros de esta cuestión incluso entre los matemáticos griegos y,
finalmente, justo antes de constituirse en su forma actual, FERMAT (1601-1665), un
distinguido matemático francés, había mejorado tanto las ideas previas, que el cálculo
fue casi inventado por él. También se podría considerar a FERMAT como el inventor,
de manera conjunta con DESCARTES, de la geometría de coordenadas. En realidad, es
a DESCARTES a quien el mundo de la ciencia le debe las ideas nuevas, pero
FERMAT, sin duda alguna, llegó a ellas de manera independiente.
No es necesario, sin embargo, limitar nuestra admiración o a NEWTON, o a
LEIBNIZ. NEWTON fue un matemático y un estudioso de la ciencia física, y LEIBNIZ
fue un matemático y un filósofo, y cada uno de ellos, en su área de pensamiento, fue
uno de los más grandes hombres de genio que el mundo haya conocido. La invención
conjunta del cálculo fue la ocasión de una desafortunada y no siempre loable disputa.
NEWTON aplicaba los métodos de las fluxiones, como él llamo al tema, en 1666, y los
empleó en la composición de su Principa, aunque en el trabajo impreso se evita
cualquier notación algebraica especial. Pero no imprimió alguna declaración directa de
su método hasta 1693. LEIBNIZ publicó su primera declaración en 1684. Fue acusado
por los amigos de NEWTON de haber obtenido las ideas de un escrito de éste que le fue
mostrado de forma privada. LEIBNIZ también acusó a NEWTON de haberlo plagiado.
Hoy en día, no existen muchas dudas acerca de que ambos deben tener el crédito de ser
los descubridores independientes del cálculo. El tema había llegado a una etapa propicia
para este tipo de descubrimientos, y no hay nada sorprendente en el hecho de que dos
hombres tan capaces hayan llegado de manera independiente a él.
En la ciencia, este tipo de descubrimientos conjuntos son muy comunes. Éstos,
en general, no son hechos antes de que hayan sido llevados por tendencias previas del
pensamiento y, en ese momento, muchas mentes están en la búsqueda de las ideas
fundamentales del tema. Si nos atenemos a los descubrimientos hechos por los hombres
ingleses, veremos cómo la enunciación simultánea de la ley de la selección natural
hecha por Darwin y por Wallace, y el descubrimiento simultáneo de Neptuno, hecho por
Adams y por el astrónomo francés Leverrier, ocurrieron, a la vez, en las mentes de estos
hombres. Las disputas sobre a quién debe darse el crédito por haber descubierto o
inventado algo, están con frecuencia influidas por un indigno espíritu nacionalista. La
reflexión realmente inspiradora sugerida por la historia de las matemáticas es la unidad
de pensamiento y el interés por esta ciencia entre los hombres de tantas épocas,
naciones, y razas. Los indios, egipcios, asirios, griegos, árabes, italianos, franceses,
129
alemanes, ingleses, y rusos, han hecho contribuciones esenciales al progreso de la
ciencia. Ciertamente, la exaltación celosa de una nación en particular por las
contribuciones hechas, no es característica de un espíritu grande.
La importancia del cálculo diferencial surge de la misma naturaleza del tema,
que es la consideración sistemática de las velocidades de crecimiento de las funciones.
Esta idea se presenta de manera inmediata al estudiar la naturaleza; la velocidad es la
tasa de crecimiento de la distancia viajada, y la aceleración es la tasa de crecimiento de
la velocidad. Así, la idea fundamental del cambio, que se encuentra en la base de toda
nuestra percepción sobre los fenómenos, sugiere inmediatamente la indagación sobre la
velocidad del mismo. Los términos familiares de “rápidamente” y “lentamente”,
obtienen su significado de una referencia tácita a las velocidades del cambio. De esta
forma, el cálculo diferencial se ocupa de la posición clave desde la cual las matemáticas
pueden ser satisfactoriamente aplicadas a la explicación del curso de la naturaleza.
Esta idea de la velocidad del cambio estaba en la mente de NEWTON, y fue
plasmada en el lenguaje en el que éste escribió sobre el tema.
Se puede dudar, sin embargo, sobre si este punto de vista, derivado de los fenómenos
naturales, se encontraba en las mentes de los matemáticos anteriores que hicieron
posible que este asunto surgiera. Ellos se encontraban más bien interesados en los
problemas más abstractos de trazar tangentes a curvas, de encontrar las longitudes de
curvas, y de encontrar las áreas encerradas o limitadas por las curvas. Estos últimos dos
problemas, de la rectificación de las curvas y de la cuadratura de las curvas, pertenecen
130
al cálculo integral, que está, no obstante, implicado en el mismo tema general que el
cálculo diferencial.
La introducción de la geometría de coordenadas hace que los dos puntos de vista
se unan. Porque (Cf. Fig. 32) dejemos que AQP sea cualquier línea curva y que PT sea
la tangente en el punto P en ella. Dejemos que los ejes de las coordenadas sean 0X y 0Y,
y que y = ƒ(x) sea la ecuación de la curva, de tal manera que 0M = x, y PM = y. Ahora,
dejemos que Q sea cualquier punto que se mueve en la curva, con coordenadas x1; y1;
entonces, y1 = ƒ(x1). Y dejemos que Q’ sea el punto en la tangente con la misma abscisa
x1; suponiendo que las coordenadas de Q’ sean x1 y y’. Ahora imaginemos que N se
mueve a lo largo del eje 0X de izquierda a derecha con una velocidad uniforme;
entonces es fácil ver que la ordenada y’ del punto Q’ en la tangente TP también se
incrementa uniformemente mientras Q’ se mueve a lo largo de la tangente en una forma
correspondiente. En realidad, es fácil ver que la proporción de la velocidad de
incremento de Q’N a la velocidad de incremento de 0N es en la proporción de Q’N a
TN, que es la misma en todos los puntos de la línea recta. Pero la velocidad de
incremento de QN, que es la velocidad de incremento de ƒ(x1), varía de punto a punto en
la curva siempre y cuando ésta no sea recta. Mientras Q pasa a través del punto P, la
velocidad de incremento de ƒ(x1) - donde x1 coincide con x por el momento - es la
misma que la velocidad de incremento de y’ en la tangente en P. Por lo tanto, si tenemos
un método general de determinar la velocidad de incremento de una función ƒ(x) de una
variable x, entonces podemos determinar la pendiente de una tangente en cualquier
punto (x, y) en una curva, y desde allí, podemos trazarla. Así, los problemas de trazar
tangentes a una curva, y de determinar las velocidades de incremento de una función,
son realmente idénticos.
Debe notarse que, como en los casos de las secciones cónicas y de la
trigonometría, el más artificial de los dos puntos de vista constituye la base sobre la cual
el tema a tratar surge verdaderamente. El aspecto realmente fundamental de la ciencia
suele florecer en épocas comparativamente tardías con el desarrollo de sus ideas
iniciales. Constituye una generalización histórica bien estudiada y definida, que la
última cosa a ser descubierta en cualquier ciencia es aquello de lo que se trata la ciencia.
Los hombres van a tientas durante los siglos, guiados solamente por un sombrío instinto
y una desconcertante curiosidad, hasta que, por fin, “una gran verdad es desatada”.
Tomemos algunos casos especiales para familiarizarnos con el tipo de ideas que
queremos hacer precisas. Un tren está en movimiento, ¿cómo podemos determinar su
131
velocidad en algún instante, digamos, al mediodía? Podemos tomar un intervalo de
cinco minutos que incluya al mediodía, y medir qué tanto viajó el tren en ese periodo.
Supongamos que encontramos que recorrió 5 millas, entonces podemos concluir que el
tren viajaba a una velocidad de 60 millas por hora. Pero cinco millas es una distancia
larga, y no podemos estar seguros de que el tren se movía a este paso al mediodía. Al
mediodía pudo haber estado viajando a 70 millas por hora, y después haber frenado un
poco. Sería más seguro trabajar con un intervalo más pequeño, digamos un minuto que
incluya al mediodía, y medir el espacio recorrido en ese periodo. Pero para algunos
propósitos es necesaria una mayor precisión, y un minuto puede ser demasiado largo.
En la práctica, la necesaria inexactitud de nuestras mediciones hace que sea inútil el
considerar periodos demasiado pequeños de medición. Pero en teoría, mientras más
pequeño sea el periodo, mejor, y estamos tentados a decir que, para una precisión ideal,
se requiere un periodo infinitamente pequeño. Los matemáticos más viejos, en
particular LEIBNIZ, no solamente estaban tentados, sino entregados a la tentación, y así
lo dijeron. Incluso ahora es una forma de expresión útil, siempre que sepamos
interpretarla en el lenguaje del sentido común. Es curioso que, en su exposición de los
fundamentos del cálculo, NEWTON, el científico natural, sea mucho más filosófico que
LEIBNIZ, el filósofo, y que, por otra parte, LEIBNIZ proporcionara la admirable
notación que ha sido tan esencial al progreso de la materia.
Ahora tomemos otro ejemplo dentro de la región de las matemáticas puras.
Procedamos a encontrar la tasa de incremento de la función x2 para cualquier valor x de
su argumento. Todavía no hemos definido lo que queremos decir por tasa de
crecimiento*. Intentaremos hacerlo y además comprender su significado en relación con
este caso particular. Cuando x aumenta a x + h, la función x2 aumenta a (x + h)2; de
modo que el aumento total ha sido 22)( xhx −+ , debido a un aumento h en el
argumento. Por lo tanto, a lo largo del intervalo x a (x + h), el aumento promedio de la
función por el aumento de la unidad del argumento es ( )
.22
h
xhx −+ Pero (x + h)2 = x2 +
2hx + h2, y entonces ( )
.22 222
hxh
hhx
h
xhx +=+=−+ Así, 2x + h es el aumento
promedio de la función x2 por el aumento de la unidad del argumento, siendo el
promedio asumido por el intervalo x a x + h. Pero 2x + h depende de h, el tamaño del
* O velocidad de crecimiento. Utilizo ambos términos como sinónimos ya que, para los propósitos de esta exposición, no hay diferencia entre ellos. Nota del Traductor.
132
intervalo. Evidentemente debemos de obtener lo que deseamos, esto es, la tasa de
incremento en el valor x del argumento, al hacer disminuir a h cada vez más. Por
consiguiente, en el límite, cuando h ha disminuido indefinidamente, decimos que 2x es
la tasa de incremento de x2 en el valor x del argumento.
Parece que en este punto estamos siendo conducidos, de nuevo, en contra de la
idea de cantidades infinitamente pequeñas en el uso de las palabras “en el límite, cuando
h ha disminuido indefinidamente”. LEIBNIZ sostuvo que, por más misterioso que
pueda sonar, realmente existen tales cosas como cantidades infinitamente pequeñas, y,
por supuesto, números infinitamente pequeños correspondientes a ellas. El lenguaje y
las ideas de NEWTON estaban más en concordancia con las líneas modernas, pero no
tuvo éxito en exponer este tema de manera más explícita como para que fuera lo
suficientemente evidente, sino que, más bien, explicó las ideas de LEIBNIZ en un
lenguaje indirecto. La explicación real del tema que nos ocupa fue primeramente dada
por WEIERSTRASS y por la Escuela de matemáticos de Berlín, a mediados del siglo
diecinueve. Pero entre LEIBNIZ y WEIERSTRASS, había surgido una abundante
literatura, tanto matemática como filosófica, alrededor de estas cantidades infinitamente
pequeñas y misteriosas que los matemáticos habían descubierto, y que los filósofos
procedieron a explicar. Algunos filósofos, el Obispo BERKELEY por ejemplo, negaron
correctamente la validez de toda esta idea, aunque por razones distintas de las indicadas
aquí. Pero el hecho curioso siguió siendo que, a pesar de todas las críticas a los
fundamentos de este tema, no había duda de que el procedimiento matemático era
correcto. En realidad, el tema era correcto, aunque las explicaciones no lo fueran. Es
esta posibilidad de estar en lo correcto, aunque con explicaciones totalmente erróneas de
lo que se está haciendo, lo que hace que las críticas externas - esto es, en lo que se
refiere a intentar detener la búsqueda de un método - , sean singularmente estériles e
insignificantes en el progreso de la ciencia. El instinto de los observadores capaces, y su
sentido de la curiosidad, debido al hecho de que obviamente se están acercando a algo,
son guías lo suficientemente seguras. De cualquier manera, el efecto general del éxito
del cálculo diferencial fue generar una gran cantidad de mala filosofía, centrada
alrededor de la idea de lo infinitamente pequeño. Las reliquias de esta verborrea se
pueden encontrar todavía en muchos libros de texto de matemáticas elementales que
tratan sobre cálculo diferencial. Es muy cierto el decir que, cuando un matemático o un
filósofo escriben con una profanidad oscura, están hablando cosas sinsentido.
133
NEWTON hubiera enunciado la cuestión al decir que, mientras h se acerca a
cero, en el límite 2x + h, se convierte en 2x. Nuestra tarea es ahora explicar esta
declaración para demostrar que en realidad no asume la existencia de las cantidades
infinitamente pequeñas de LEIBNIZ. Al leer el método newtoniano de la declaración, es
sumamente tentador el buscar simplicidad al decir que 2x + h es 2x cuando h es cero.
Pero esto no se va a hacer, porque de este modo se suprimiría el intervalo de x a x + h,
sobre el cual se calculó el incremento promedio. El problema es, cómo podemos
mantener un intervalo de longitud h sobre el cual podamos calcular el incremento
promedio, y, al mismo tiempo, tratar o considerar a h como si fuese cero. NEWTON
consiguió esto a partir del concepto del límite, y ahora procederemos a explicar su
significado real según WEIERSTRASS.
En primer lugar, debemos notar que, al discutir 2x + h, hemos pensado a x como
fija en valor y a h como variable. En otras palabras, x ha sido tratada como una variable
“constante”, o parámetro, como explicamos en el capítulo IX; y realmente hemos
considerado a 2x + h como una función del argumento h. Por consiguiente, podemos
generalizar la cuestión, y preguntarnos qué estamos queriendo decir con que la función
ƒ(h) tiende al límite l, esto es, mientras su argumento h tiende al valor cero. Pero
debemos ver, de nuevo, que el valor especial cero para el argumento, no pertenece a la
esencia de la cuestión; y entonces generalizamos aún más, y nos preguntamos qué
queremos decir con que la función ƒ(h) tiende al límite l mientras h tiende al valor a.
Ahora bien, de acuerdo con la explicación de WEIERSTRASS, toda la idea de h
tendiendo al valor a, aunque proporciona una especie de ilustración metafórica de cómo
nos estamos conduciendo, no es idónea en sí misma. De hecho, es sumamente obvio
que, mientras conservemos algo como “h tendiendo a a” como una idea fundamental,
estaremos en el ámbito de lo infinitamente pequeño, porque esto implica la noción de h
siendo infinitamente cercana a a. Y esto es justamente de lo que nos queremos deshacer.
De acuerdo con esto, debemos replantear nuestra frase a ser explicada, y
preguntarnos qué queremos decir con que el límite de la función ƒ(h) en a es l.
El límite de ƒ(h) en a es una propiedad de la vecindad de a, donde “vecindad” es
usada en el sentido definido en el capítulo XI durante la discusión de la continuidad de
las funciones. El valor de la función ƒ(h) en a es ƒ(a); pero el límite es distinto en idea
del valor, y puede ser diferente a él, e incluso puede existir cuando el valor no haya sido
aún definido. También debemos usar el término “estándar de aproximación” en el
sentido en el que fue definido en el capítulo XI. De hecho, en la definición de
134
“continuidad” dada al final de ese capítulo, hemos prácticamente definido un límite. La
definición de un límite es:
Una función ƒ(x) tiene el límite l en el valor a de su argumento x, cuando en la
vecindad (cercanía)* de a sus valores se aproximan a l dentro de cada estándar de
aproximación.
Comparemos esta definición con la dada para la continuidad, a saber:
Una función ƒ(x) es continua en un valor a de su argumento, cuando en la
vecindad (cercanía) de a, sus valores se aproximan a su valor en a dentro de cada
estándar de aproximación.
Es evidente que una función es continua en a cuando (i) posee un límite en a, y
(ii) ese límite es igual a su valor en a. Así, los ejemplos de continuidad que hemos dado
al final del capítulo XI, son ejemplos de la idea de un límite, a saber, todos ellos estaban
dirigidos a probar que ƒ(a) era el límite de ƒ(x) en a para las funciones consideradas y
para el valor de a considerado. En realidad, es más instructivo considerar el límite en un
punto donde una función no sea continua. Por ejemplo, consideremos la función
graficada en la fig. 20 del capítulo XI. Esta función ƒ(x) está definida para tener el valor
1 para todos los valores del argumento excepto para los enteros 1, 2, 3, etc., teniendo
para estos valores integrales el valor 0. Pensemos en su límite cuando x = 3. Hemos
notado que en la definición de límite, el valor de la función en a (en este caso, a = 3),
está excluido. Pero, excluyendo a ƒ(3), los valores de ƒ(x), cuando x se encuentra dentro
de cualquier intervalo que (i) contenga a 3 no como un punto-final, y (ii) no se extienda
hasta 2 y 4, serán todos iguales a 1; y, por lo tanto, estos valores se aproximarán a 1
dentro de cada estándar de aproximación. Por consiguiente, 1 es el límite de ƒ(x) en el
valor 3 del argumento x, pero, por definición, ƒ(3) = 0.
Este es un caso de una función que posee tanto un valor como un límite en el
valor 3 del argumento, pero el valor no es igual al límite. Al final del capítulo XI, se
consideró a la función x2 en el valor 2 del argumento. Su valor en 2 es 22, esto es, 4, y se
probó que su límite también era 4. Entonces, tenemos una función con un valor y un
límite que son iguales.
Finalmente, llegamos al caso que es esencialmente importante para nuestros
propósitos, a saber, a una función que posee un límite, pero ningún valor definido en un
cierto valor de su argumento. No necesitamos ir muy lejos para encontrar tal función,
* La palabra dentro de los paréntesis es mía. Nota del Traductor.
135
x
x2 servirá para nuestros propósitos. Ahora bien, en cualquier libro sobre matemáticas,
podemos encontrar la ecuación 22 =x
x, escrita sin más. Pero existe una dificultad en
esto; porque cuando x es cero, ;0
02 =x
x y
0
0 no tiene un significado definido. Así, el
valor de la función x
x2 en x = 0, no tiene significado definido. Pero para cualquier otro
valor de x, el valor de la función x
x2 es 2. De esta forma, el límite de
x
x2 en x = 0 es 2,
y no tiene un valor en x = 0. De manera similar, el límite de x
x2
en x = a es a sea lo que
pueda ser a, de tal forma que el límite de x
x2
en x = 0 es 0. Pero el valor de x
x2
en x = 0
toma la forma 0
0, que no tiene un significado definido. Así, la función
x
x2
tiene un
límite, pero no un valor en 0.
Volvemos ahora al problema con el cual empezamos nuestra discusión acerca de
la naturaleza del límite. ¿Cómo vamos a definir la tasa de incremento de la función x2 en
cualquier valor x de su argumento? Nuestra respuesta es que esta tasa de incremento es
el límite de la función ( )
h
xhx 22 −+ en el valor cero de su argumento h. (Nótese que x
es aquí una “constante”). Veamos cómo funciona esta respuesta bajo la luz de nuestra
definición de límite. Tenemos que
( ) ( ).
22 222
h
hxh
h
hhx
h
xhx +=+=−+
Ahora, al encontrar el límite de ( )
h
hxh +2 en el valor 0 del argumento h, el valor
(si lo hay) de la función en h = 0 está excluido. Pero para todos los valores de h, excepto
h = 0, podemos dividir por medio de h. Así, el límite de ( )
h
hxh +2 en h = 0 es el mismo
que el de 2x + h en h = 0. Ahora, con cualquier estándar de aproximación que
escojamos, al considerar el intervalo de k2
1− a k2
1+ , vemos que, para valores de h que
136
caen o están dentro de él, 2x + h difiere de 2x por menos de k2
1, esto es, por menos de
k. Esto es cierto para cualquier estándar k. Por lo tanto, en la vecindad (cercanía) del
valor 0 para h, 2x + h se aproxima a 2x dentro de cada estándar de aproximación, y, por
esto, 2x es el límite de 2x + h en h = 0. Por lo tanto, por lo que se ha dicho arriba, 2x es
el límite de ( )
h
xhx −+ 2
en el valor 0 para h. Se sigue, por esto, que 2x es lo que hemos
estado llamando la tasa de incremento de x2 en el valor x del argumento. Este método
nos conduce a la misma tasa o velocidad de incremento para x2, igual que lo hacía el
método de LEIBNIZ, consistente en hacer que h tienda hacia lo “infinitamente
pequeño”.
A partir de ahora, se usan términos mucho más abstractos para lo que hasta
ahora hemos llamado la “tasa de incremento” de una función, como “coeficiente
diferencial”, o “función derivada”. La definición general es como sigue: el coeficiente
diferencial de la función ƒ(x) es el límite, si existe, de la función ( ) ( )
h
xfhxf −+ del
argumento h en el valor 0 de su argumento.
¿Cómo es que hemos, a partir de esta definición y de la definición subsidiaria de
lo que es un límite, evitado la noción de “números infinitamente pequeños”, que tanto
preocupaba a nuestros antepasados matemáticos? Para ellos, la dificultad surgió porque,
por una parte, tuvieron que usar un intervalo x a x + h sobre el cual pudieran calcular el
incremento promedio y, por otra parte, finalmente quisieron poner h = 0. El resultado
fue que parecían haber llegado a la noción de un intervalo existente de tamaño 0.
¿Cómo hemos evitado nosotros esa dificultad? Es muy simple: usamos la noción de que
se puede encontrar algún intervalo, con tales y cuales propiedades, correspondiente a
cualquier estándar de aproximación. La diferencia es que nosotros hemos tenido en
cuenta la importancia de la noción de la “variable”, y ellos no. Así, al final de nuestra
exposición de las nociones esenciales del análisis matemático, volvemos a las ideas con
las que empezamos nuestra investigación en el capítulo II, esto es, que en las
matemáticas, las ideas fundamentalmente importantes son aquellas de “algunas cosas” y
“cualesquiera cosas”.
137
CAPÍTULO XVI
GEOMETRÍA
La geometría, al igual que el resto de las matemáticas, es abstracta. En ella, se
estudian las propiedades de las formas y de las posiciones relativas de las cosas. Pero no
necesitamos considerar quién observa las cosas, o si está familiarizado con ellas por la
vista, el tacto, o el oído. En pocas palabras, ignoramos todas las sensaciones
particulares. Más aún, las cosas particulares, como el recinto del Parlamento, o el globo
terrestre, también son ignoradas. Cada proposición se refiere a cualesquiera cosas con
tales y cuales propiedades geométricas. Desde luego, el observar ejemplos particulares
de esferas, conos, triángulos y cuadrados ayuda a nuestra imaginación. Pero las
proposiciones no se aplican solamente a las figuras representadas en este libro, sino a
cualesquiera figuras de ese tipo.
Así, la geometría, lo mismo que el álgebra, está dominada por las ideas de
“cualesquiera” y “algunas” cosas. Pero también estudia las interrelaciones existentes
entre los conjuntos de las cosas. Por ejemplo, consideremos cualesquiera dos triángulos
ABC y DEF.
¿Qué relaciones deben existir entre algunas de las partes de estos triángulos, a
fin de que los triángulos sean iguales en todos los aspectos? Esta es una de las primeras
investigaciones que se deben llevar a cabo en todas las geometrías elementales.
138
Es el estudio de un cierto conjunto de correlaciones posibles entre los dos triángulos. La
respuesta es que los triángulos son iguales en todos los aspectos si: o bien (a) dos lados
de uno y su ángulo comprendido* son iguales respectivamente a dos lados del otro y a
su ángulo comprendido; o (b) dos ángulos de uno y el lado que los une son iguales
respectivamente a dos ángulos del otro y al lado que los une; o (c) tres lados de uno son
iguales respectivamente a tres lados del otro.
Esta respuesta sugiere una investigación posterior. ¿Cuál es la naturaleza de la
correlación entre los triángulos, cuando los tres ángulos de uno son iguales
respectivamente a los tres ángulos del otro? Esta investigación posterior nos conduce
naturalmente a la teoría de la similitud (Cf. Cap. XIII), que constituye otro tipo de
correlación.
Tomemos otro ejemplo, y consideremos la estructura interna del triángulo ABC.
Sus lados y ángulos están interrelacionados, ya que el ángulo mayor es opuesto al lado
mayor, y los ángulos de la base de un triángulo isósceles son iguales. Si procedemos a
la trigonometría, esta correlación recibe una determinación más exacta, bajo la forma
,c
senC
b
senB
a
senA == ,cos2222 Abccba −+= con dos fórmulas similares. También
existe la todavía más simple correlación entre los ángulos del triángulo, a saber, que su
suma es igual a dos ángulos rectos; y entre los tres lados, a saber, que la suma de las
longitudes de cualesquiera dos lados es mayor que la longitud del tercero.
Así, el método verdadero para estudiar geometría es pensar en figuras simples,
tales como el triángulo, el paralelogramo, y el círculo, e investigar las correlaciones
entre sus diversas partes. El geómetra no debe tener en mente una proposición aislada,
sino una figura en la que sus distintas partes son mutuamente interdependientes. Así
como en el álgebra, debe generalizar el triángulo en el polígono, y el lado en la sección
cónica. O, siguiendo el camino inverso, debe clasificar a los triángulos de acuerdo con
si son equiláteros, isósceles, o escalenos, y a los polígonos de acuerdo con si el número
de sus lados, y a las secciones cónicas de acuerdo con si son hipérbolas, elipses, o
parábolas.
Los ejemplos precedentes demuestran cómo las ideas fundamentales de la
geometría son exactamente las mismas que aquellas del álgebra; excepto en que el
álgebra trata con números, y la geometría con líneas, ángulos, áreas, y con otras * O ángulo incluido. En inglés “included angle”. Nota del Traductor.
139
entidades geométricas. Esta identidad es una de las razones por las cuales tantas
verdades geométricas pueden ser puestas bajo un arreglo algebraico. De esta forma, si
A, B, y C son los números de grados respectivos a los ángulos del triángulo ABC, la
correlación entre los ángulos se puede representar por la ecuación A + B + C = 180°; y
si a, b, c son los números de pies* respectivos a los tres lados, la correlación entre los
lados se puede representar por a < b + c, b < c + a, c < a + b. También las fórmulas
trigonométricas escritas arriba son otros ejemplos del mismo hecho. En otras palabras,
la noción de la variable y de la correlación entre las variables es tan esencial en la
geometría como lo es en el álgebra.
Pero el paralelismo entre la geometría y el álgebra puede ser desarrollado
todavía más, debido al hecho de que las longitudes, áreas, volúmenes, y ángulos, son
todos medibles; entonces, por ejemplo, el tamaño de cualquier longitud puede ser
determinado por el número (no necesariamente entero) de veces que ésta contiene
arbitrariamente alguna unidad conocida, y de manera similar para las áreas, volúmenes,
y ángulos. Las fórmulas trigonométricas dadas arriba son ejemplos de este hecho. Pero
recibe su aplicación triunfal en la geometría analítica. A este gran tema se le da
comúnmente el mal nombre de secciones cónicas analíticas, poniendo atención así
solamente a una de sus subdivisiones. Es como si a la gran ciencia de la antropología, se
le llamará el estudio de las narices, debido al hecho de que las narices son una parte
prominente del cuerpo humano.
Aunque los procedimientos matemáticos en la geometría y en el álgebra son, en
esencia, idénticos y están entrelazados en su desarrollo, existe necesariamente una
distinción fundamental entre las propiedades del espacio y las propiedades del número;
de hecho, entre toda la diferencia esencial entre el espacio y el número. La
“espaciosidad” del espacio y la “numerosidad” del número son cosas esencialmente
distintas, y deben ser aprehendidas directamente. Ninguna de las aplicaciones del
álgebra en la geometría, o de la geometría en el álgebra, avanza ningún paso en el
camino para eliminar esta distinción vital.
Una diferencia muy marcada entre el espacio y el número es que el primero
parece ser mucho menos abstracto y fundamental que el último. El número de los
arcángeles puede ser contado simplemente porque son cosas. Cuando sabemos que sus
nombres son Rafael, Gabriel, y Miguel, y que estos distintos nombres representan
* Pies entendidos como medida de longitud. Nota del Traductor.
140
distintos seres, sabemos, sin tener que preguntarnos más cosas, que son tres. Todas las
sutilezas en el mundo sobre la naturaleza de las existencias angelicales no pueden
alterar este hecho, dada la concesión de las premisas.
Pero aún no sabemos cuál es su relación con el espacio. ¿Existen, en absoluto, en
el espacio? Probablemente es igualmente sinsentido el decir que están aquí, o allá, o en
cualquier parte, o en todas partes. Su existencia puede simplemente no tener relación
alguna con las localidades en el espacio. De acuerdo con esto, mientras los números se
deben aplicar a todas las cosas, el espacio no necesariamente debe hacerlo.
La percepción de la localidad de las cosas podría parecer estar acompañada, o
por lo menos estar involucrada, con muchas, o todas, de nuestras sensaciones. Es
independiente de cualquier sensación particular, en el sentido de que acompaña muchas
de éstas. Pero es una peculiaridad especial de las cosas que aprehendemos por las
mismas. La aprehensión directa de lo que entendemos por las posiciones de las cosas
con respecto unas con otras es una cosa sui generis, así como también lo son las
aprehensiones de los sonidos, colores, sabores, y olores. A primera vista, parecería por
lo tanto que las matemáticas, en la medida en que incluyen a la geometría, no son
abstractas en el sentido en el que definimos la abstracción en el capítulo I.
Esto, sin embargo, es un error; porque la “espaciosidad” del espacio no tiene
cabida en nuestro razonamiento geométrico. Aunque sí tiene cabida en las intuiciones
geométricas de los matemáticos, en formas peculiares y personales para cada individuo.
Pero lo que entra en el razonamiento son simplemente ciertas propiedades de las cosas
en el espacio, o de cosas que forman el espacio, y cuyas propiedades son completamente
abstractas, en el sentido en el que definimos la abstracción en el capítulo I; estas
propiedades no involucran ninguna aprehensión, intuición, o sensación espacial
peculiar. Tienen exactamente la misma base que las propiedades matemáticas del
número. Así, la intuición espacial - que es tan esencial al estudio de la geometría - es
lógicamente irrelevante: no tiene cabida en las premisas cuando éstas están propiamente
declaradas, ni tampoco en algún paso del razonamiento. Tiene la importancia práctica
de constituir un ejemplo, que es esencial para la estimulación de nuestros pensamientos.
Los ejemplos son igualmente necesarios para estimular nuestros pensamientos sobre el
número. Cuando pensamos en “dos” y en “tres”, vemos trazos en una fila, o pelotas
apiladas, o cualquier otro agregado físico de cosas particulares. La peculiaridad de la
geometría es la fijeza y la abrumadora importancia de un ejemplo particular que ocurre
en nuestras mentes. Cuando esto se expone, la forma lógica abstracta que adopta es: “Si
141
cualesquiera colecciones de cosas tienen tales y cuales propiedades abstractas, también
tienen tales y cuales otras propiedades abstractas”. Pero lo que aparece ante la mente es
una colección de puntos, líneas, superficies, y volúmenes en el espacio: este ejemplo
inevitablemente aparece, y es el ejemplo por sí mismo lo que da a la proposición su
interés. Sin embargo, incluso con toda su abrumadora importancia, no es más que un
ejemplo.
La geometría, vista como una ciencia matemática, es una división de la más
general ciencia del orden. Puede ser llamada la ciencia del orden dimensional; el título
de “dimensional” ha sido introducido debido a las limitaciones, que la reducen a sólo
una parte de la ciencia general del orden, que son tales como para producir las
relaciones regulares de las líneas rectas en planos, y de los planos en la totalidad del
espacio.
Es fácil entender la importancia práctica del espacio en la formación de la
concepción científica de un mundo físico externo. Por un lado, nuestras percepciones
espaciales están entrelazadas con nuestras distintas sensaciones, además de que las
primeras conectan a las últimas. Normalmente, juzgamos que tocamos un objeto en el
mismo lugar en el que lo vemos; e incluso en caso anormales lo tocamos en el mismo
espacio en el que lo vemos, y este es el hecho real y fundamental que ata nuestras
distintas sensaciones. De acuerdo con esto último, las percepciones espaciales son, en
un sentido, la parte común de nuestras sensaciones. Sucede que las propiedades
abstractas del espacio forman una gran parte de lo que sea que constituya algo de interés
espacial. No es demasiado decir, que a cada propiedad del espacio le corresponde una
declaración o principio matemático abstracto. Para tomar el más desfavorable de los
casos, una curva puede tener una belleza especial en su forma: pero a esta forma le
corresponderán algunas propiedades matemáticas abstractas, que son propias de esta
forma, y no de otras.
Para recapitular: (1) las propiedades del espacio que son investigadas en la
geometría, como las del número, son propiedades que pertenecen a cosas como cosas, y
sin ninguna referencia especial a algún modo particular de aprehensión; (2) la
percepción espacial acompaña a nuestras sensaciones, probablemente a todas ellas,
ciertamente a muchas; pero no parece haber una cualidad necesaria en las cosas, como
para que deban existir todas en un espacio o en cualquier espacio.
142
CAPÍTULO XVII
CANTIDAD
En el capítulo anterior, señalamos que las longitudes son medibles en términos
de alguna unidad de longitud, las áreas en términos de una unidad de área, y los
volúmenes en términos de una unidad de volumen.
Cuando tenemos un conjunto de cosas, tales como longitudes medibles en
términos de cualquiera de las unidades descritas, decimos que son cantidades del mismo
tipo. Así, las longitudes son cantidades del mismo tipo, como también lo son las áreas y
los volúmenes. Pero un área no es una cantidad del mismo tipo que una longitud, ni del
mismo tipo que un volumen. Pensemos un poco más en lo que quiere decir que algo es
medible, tomando a las longitudes como ejemplo.
Las longitudes son medibles por la regla del pie*. Al transportar la regla del pie
de un lugar a otro, podemos hacer un juicio acerca de la igualdad de las longitudes. De
nuevo, tres longitudes adyacentes, cada una de un pie, forman una longitud total de tres
pies. Así, para medir longitudes, debemos determinar la igualdad de las longitudes y la
adición (suma) de las longitudes. Cuando se ha hecho un examen de este tipo, tal como
transportar la regla del pie, decimos que las longitudes son iguales; y cuando se ha
aplicado algún proceso, para asegurarnos de que las longitudes son contiguas y no
superpuestas, decimos que las longitudes han sido añadidas (o sumadas) para formar
una longitud total. Pero no podemos tomar arbitrariamente cualquier examen como el
examen de igualdad, ni tampoco cualquier proceso como el proceso de adición. Los
resultados de las operaciones de adición y de los juicios sobre la igualdad deben estar de
acuerdo con ciertas condiciones preconcebidas. Por ejemplo, la adición de dos
cantidades más grandes, debe producir una longitud mayor que aquella producida por la
adición de dos cantidades más pequeñas. Estas condiciones preconcebidas, cuando son
formuladas de manera precisa, pueden ser llamadas axiomas de cantidad. La única
cuestión que puede surgir acerca de su veracidad o falsedad es si, cuando los axiomas
están satisfechos, necesariamente debemos obtener lo que la gente ordinaria entiende
* O del metro, yarda, etc. Nota del Traductor.
143
por cantidades. Si no lo obtenemos, entonces quiere decir que el nombre “axiomas de
cantidad” es imprudente, eso es todo.
Estos axiomas de cantidad son completamente abstractos, de igual forma que lo
son las propiedades matemáticas del espacio. Son los mismos para todas las cantidades,
y no presuponen algún modo especial de percepción. Las ideas asociadas con la noción
de cantidad son los medios por los cuales un continuo como una línea, un área, o un
volumen, pueden ser divididos en partes definidas. Entonces se procede a contar estas
partes, de modo que los números puedan ser usados para determinar las propiedades
exactas de un todo continuo.
Nuestra percepción sobre el flujo del tiempo y sobre la sucesión de los eventos
es un muy buen ejemplo de la aplicación de estas ideas de cantidad. Nosotros medimos
el tiempo (como ya se ha dicho al considerar la periodicidad) por la repetición de
eventos similares: la quema de las pulgadas sucesivas de una vela, la rotación de la
Tierra con relación a las estrellas fijas, la rotación de las manecillas de un reloj, son
todos ejemplos de tales repeticiones. Los eventos de este tipo toman el lugar de la regla
del pie en relación con las longitudes. No es necesario asumir que los eventos de
cualquiera de estos tipos son exactamente iguales en duración en cada recurrencia (o
repetición). Lo que sí es necesario es que una regla nos permita expresar las duraciones
relativas de, digamos, dos ejemplos de este tipo. Por ejemplo, podemos suponer que la
velocidad de la rotación de la Tierra está disminuyendo, de manera que cada día es más
largo que el día precedente por alguna fracción de segundo. Tal regla nos permite
comparar la longitud de cualquier día con la longitud de cualquier otro día. Pero lo que
es esencial, es que una serie de repeticiones, tal como la sucesión de los días, debe ser
tomada como la serie estándar; y, si los distintos eventos de esta serie no son tomados a
partir de duraciones iguales, esa regla debe regular la duración a ser asignada a cada día
en términos de la duración de cualquier otro día.
¿Cuáles son, entonces, los requisitos que tal regla debe tener? En primer lugar,
debe conducirnos a poder asignar duraciones casi cercanas a los eventos que el sentido
común juzga como poseedores de duraciones iguales. Una regla que haga que las
longitudes de los días sean sumamente distintas, y que haga que las velocidades de
operaciones aparentemente similares varíen absolutamente fuera de la proporción de la
aparente minuciosidad de sus diferencias, nunca podría tener este requisito. Por lo tanto,
el primer requisito es el acuerdo general con el sentido común. Pero esto no es lo
suficientemente necesario como para determinar la regla, porque el sentido común es un
144
observador tosco y que se satisface fácilmente. El siguiente requisito es que los ajustes
minuciosos de la regla deben ser hechos para permitir las declaraciones más simples de
las leyes de la naturaleza. Por ejemplo, los astrónomos nos dicen que la rotación de la
Tierra está desacelerando, de manera que cada día es más grande en longitud por una
inconcebible fracción de segundo. La única razón que tienen para su afirmación (como
fue indicada de manera más completa en la discusión sobre la periodicidad), es que, sin
ella, se tendrían que abandonar las leyes newtonianas sobre el movimiento. A fin de que
las leyes del movimiento se mantengan simples, se altera la medición del tiempo. Este
es un procedimiento perfectamente legítimo, siempre y cuando sea completamente
entendido.
Lo que se ha dicho arriba acerca de la naturaleza abstracta de las propiedades
matemáticas del espacio, es aplicable - con algunos cambios en el lenguaje - a las
propiedades matemáticas del tiempo. Una sensación sobre el flujo del tiempo acompaña
todas nuestras sensaciones y percepciones, y se puede hacer un paralelismo con
prácticamente todo lo que nos interesa con respecto al tiempo, debido a las propiedades
matemáticas abstractas que le atribuimos. De manera inversa, todo lo que se ha dicho
acerca de los dos requisitos para la regla por la cual determinamos la longitud del día,
también se aplica a la regla para determinar la longitud de una medida de yarda*, esto
es, parece que la medida de la yarda conserva la misma longitud a medida que se
mueve. De acuerdo con esto, cualquier regla debe hacer resaltar que, aparte de cambios
minuciosos, mantiene longitudes invariables. De nuevo, el segundo requisito es este:
debe establecerse una regla para los cambios minuciosos que nos permita expresar las
leyes de la naturaleza más simples. Por ejemplo, de acuerdo con el segundo requisito,
las medidas de la yarda están supuestas a expandirse y a contraerse por los cambios en
la temperatura, de acuerdo con las sustancia son las que fueron fabricadas.
Aparte de los hechos de que nuestras sensaciones están acompañadas por
percepciones de localidad y de duración, y de que las líneas, áreas, volúmenes, y
duraciones, son cada una de ellas cantidades, el uso de la teoría de números será muy
secundario en la exploración de las leyes del Universo. Tal como es, la ciencia física
reposa sobre las principales ideas del número, de la cantidad, del espacio, y del tiempo.
Las ciencias matemáticas asociadas con estas ideas no conforman el todo de las
* O metro, pie, etc. Nota del Traductor.
145
matemáticas, pero son el sustrato de la física matemática tal como ésta existe en la
actualidad.
BIBLIOGRAFÍA
NOTA SOBRE EL ESTUDIO DE LAS MATEMÁTICAS
La dificultad que los principiantes encuentran al estudiar esta ciencia se debe a la gran cantidad
de detalles técnicos que se han ido acumulando en los libros de texto elementales, y que oscurecen las
ideas realmente importantes.
Los primeros temas de estudio, aparte de un conocimiento sobre la aritmética, que se da
presupuesto, deben ser la geometría elemental y el álgebra elemental. Los cursos para ambos temas deben
ser cortos, proporcionando solamente las ideas necesarias; el álgebra debe ser estudiada gráficamente, a
fin de que, en la práctica, las ideas elementales de la geometría de coordenadas sean también asimiladas.
El siguiente par de temas deben ser la trigonometría elemental y la geometría de coordenadas de la línea
recta y del círculo. El último de estos temas dichos es realmente corto, porque se fusiona con el álgebra.
Siguiendo estos lineamientos, el estudiante estará preparado para entrar en el tema de las secciones
cónicas, estudiando un curso muy corto de secciones cónicas geométricas, y uno más largo de cónicas
analíticas. Pero, en todos estos cursos, se debe tener mucho cuidado para no sobrecargar la mente con más
detalles de los necesarios para la ejemplificación de las ideas fundamentales.
El cálculo diferencial, y después el cálculo integral, deben seguir el mismo sistema de enseñanza.
Un buen maestro los habrá ejemplificado o ilustrado al considerar casos especiales en el curso sobre el
álgebra y sobre la geometría de coordenadas. Se debe leer también algún libro pequeño sobre geometría
tridimensional.
Este curso elemental de matemáticas es suficiente para algunos tipos de carrera profesional. Es
también lo necesariamente preliminar para cualquiera que desee estudiar el tema por un interés intrínseco,
y debería estar preparado para un curso más extendido. No debe esperar, sin embargo, dominar a las
matemáticas en su totalidad. Esta ciencia ha crecido a proporciones tan vastas, que probablemente ningún
matemático vivo sea capaz de dominar todos los temas.
Pasando a los tratados serios sobre este tema que deben ser leídos después de este curso
preliminar, se puede mencionar a los siguientes: Pure Geometry de Cremona (Traducción al inglés,
Clarendon Press, Oxford), Treatise on Trigonometry de Hobson, Treatise on Algebra de Chrystal (2
volúmenes), Conic Sections de Salmon, Differential Calculus de Lamb, y algún libro sobre Ecuaciones
diferenciales. Probablemente el estudiante no desee dirigir una atención igual a todos estos temas, pero
puede estudiar uno o más de ellos, dependiendo de lo que dicte su interés. Estará entonces preparado para
seleccionar trabajos más avanzados, y sumergirse en partes más desarrolladas del tema. Si su interés es el
análisis, debe entonces dominar algún tratado elemental sobre la teoría de las fracciones o sobre las
146
variables complejas; si prefiere especializarse en geometría, debe proceder a los tratados estándares sobre
la geometría analítica de tres dimensiones. Pero en esta etapa de su carrera, probablemente no requiera del
asesoramiento de esta nota.
Me he abstenido deliberadamente de mencionar cualquier trabajo o tratado elemental. Son muy
numerosos, y de distintos méritos, pero ninguno tan sobresaliente como para que requiera una mención
especial, con la consiguiente exclusión de todos los demás.