La teoría bayesiana de la decisión

Bayesian Decision Theory*

Nicolás Darío Cuevas-Alvear**

Recibido: 15 de enero de 2017
Evaluado: 20 de febrero de 2017
Aceptado: 20 de mayo de 2017

Resumen

En este artículo se lleva a cabo una explicación general sobre la teoría bayesiana de la decisión y sus conceptos básicos. Para cumplir con tal objetivo, este texto se divide en tres secciones. En la primera se explican los rasgos más generales y básicos de la teoría bayesiana de la decisión racional. En la segunda sección se explican los conceptos de preferencia, utilidad y probabilidad. Por último, en la tercera sección se presenta la teoría en funcionamiento.

´

Palabras clave: Decisión, Preferencia, Utilidad, Probabilidad

Abstract

This article is a general explanation of Bayesian Decision Theory and its basic concepts. This article is divided in three sections to fulfill its objective. In the first part the general features of the theory are explained. Then there are explained the concepts of preference, utility and probability. In the last part we will see the theory in action.

Keywords: Decision, Preference, Utility, Probability

Rasgos generales de la teoría bayesiana de la decisión

El primer punto que elaboraré para explicar qué es una teoría bayesiana de la decisión es en qué consiste una teoría de este tipo. Esta teoría es de carácter normativo y está compuesta por dos partes: la estructura formal y el mecanismo de verificación. La primera, la estructura formal, es un conjunto de conceptos que están relacionados por sus características lógicas formales. Dicho de otra manera, la estructura formal establece el marco dentro del cual el contenido de la teoría se va a elaborar. Por ejemplo, si analizamos un juego como el ajedrez, podríamos ver claramente que la estructura formal del juego son las reglas sobre el movimiento de cada una de las piezas que se van a utilizar, la cantidad y la distribución de los cuadros negros y blancos del tablero, la posición en la cual empiezan cada una de las piezas, la regla sobre cuál jugador empieza, cuánto tiempo tiene disponible para jugar y cuáles jugadas están permitidas, como el enroque largo o el corto.

Por su parte, la necesidad de formular un mecanismo de verificación proviene de la naturaleza abstracta de la estructura formal, es decir, del hecho de que todas las teorías son de carácter universal y solo se pueden verificar mediante sus instancias. Esto quiere decir que una teoría no se puede probar de manera directa, la verificación de una teoría ocurre por vía indirecta mediante los teoremas de la misma.

Ahora bien, formulémonos la siguiente pregunta: ¿qué es una teoría de la decisión racional? La respuesta es la siguiente: “la teoría de la decisión es el resultado de los esfuerzos conjuntos de economistas, matemáticos, filósofos, científicos sociales y estadísticos por explicar cómo toman o cómo deberían tomar decisiones los individuos y grupos” (Resink, 1998, p. 19). Dicho de otra manera, la teoría de la decisión racional es un modelo explicativo de la acción humana, independientemente de si la decisión es sobre cuál medio de transporte tomar para ir al trabajo, sea un bus o el metro, o una decisión sobre cuál carrera universitaria cursar. En otras palabras, la teoría de la decisión racional, si es de carácter normativo, busca explicar las acciones de un agente a la luz de las motivaciones que tuvo para llevar tales acciones a cabo (Elster, 1986, p. 2). Para comprender de mejor manera el propósito de la teoría, es pertinente examinar el método utilizado para su construcción, su presupuesto más importante, el enfoque desde el cual ataca el problema y sus componentes.

El método utilizado para la construcción de la teoría de la decisión es el individualismo metodológico. Este, “como su nombre lo indica, explica algún problema o fenómeno social a partir de los individuos, en especial a partir de ciertas hipótesis sobre su conducta” (Di Castro, 2009, p. 45). Esto quiere decir que el individualismo metodológico consiste en elaborar una hipótesis sobre el comportamiento del individuo que sirve como punto de partida para explicar acciones específicas. Según Resnik (1998), el sujeto de análisis de la teoría puede ser un individuo físico, un individuo jurídico, un grupo que toma decisiones como un individuo, como una nación, o una institución. Sin embargo, Elster (1986) crítica este punto porque la explicación de las motivaciones del individuo se hace a partir de los conceptos de creencia y deseo. Estos solo pueden aplicarse a individuos físicos porque no existen las creencias colectivas o deseos colectivos. Lo anterior excluye la posibilidad de considerar a un grupo, una nación o una institución como un individuo.

El presupuesto central sobre la conducta de los individuos en la teoría de la decisión es la racionalidad. Esta se entiende de manera instrumental, es decir, como la capacidad de “elegir la estrategia que mejor satisface los deseos del agente dadas sus creencias y sus restricciones” (Di Castro, 2009, p. 47). Dicho de otra manera, la gente elige los mejores objetos o situaciones que pueden conseguir. Por ejemplo, si un hombre desea comer y se encuentra en una situación en la cual debe decidir si comer pasta o carne, este elegirá el objeto o la situación en la cual crea que su hambre será satisfecha de mejor manera.

Esta hipótesis supone que la acción debe explicarse a partir de categorías psicológicas debido a su componente intencional 1. Esto queda expuesto en la relación entre la intención y la acción que está determinada por el presupuesto de racionalidad: la intención, configurada por las creencias y los deseos del agente, es causa de la acción. En pocas palabras, se considera la acción como una conducta guiada por un propósito. Por esa razón, como sostienen Bossert & Suzumura (2010) puede analizarse por medio de la relación fines y medios, es decir, por la relación entre los deseos que determinan los fines y las creencias que determinan los medios. Esto indica que los conceptos centrales de la teoría son tres, a saber, la acción que es el elemento a explicar, y los conceptos que lo explican: el concepto de deseo junto con el de creencia. Dicho de otra manera, la utilería de la obra son esos tres conceptos y por ello es necesario caracterizarlos formalmente con el fin de explicar de manera detallada la teoría.

El enfoque que adopta la teoría bayesiana de la decisión para caracterizar formalmente los conceptos de deseo y de creencia es normativo. Este proviene de una corriente de autores con una fuerte formación matemática. La teoría utiliza un fuerte componente axiomático y matemático para cumplir su propósito. De esta manera, en la investigación del tema se estudian las consecuencias lógicas del conjunto de axiomas que se plantean en la teoría para explicar el comportamiento racional. Dicho de otra manera, la teoría postula un conjunto de restricciones formales sobre los conceptos de creencia, de deseo y de acción que determinan cuál puede ser el contenido de los mismos. Esto lo hace la teoría postulando un conjunto de axiomas o condiciones ideales sobre cómo deben ser las preferencias del individuo, cómo deben ser sus creencias y cómo deben ser sus deseos.
Esta teoría elabora una estructura formal en la cual se postulan unas restricciones sobre las intenciones del agente, compuestas por deseos y creencias, y cuáles son las acciones que racionalmente van de acuerdo con ellas. En otras palabras, y parafraseando a Peterson (2009), el enfoque matemático normativo de la teoría bayesiana de la decisión se expresa en la formulación de un conjunto de restricciones estructurales sobre cómo deben ser los estados mentales del individuo y cuáles son las acciones racionales de acuerdo con esos estados.2
Es necesario resaltar que la teoría no tiene por objetivo establecer cómo debe actuar un individuo en su vida cotidiana. “La teoría se limita a establecer un conjunto de restricciones estructurales sobre qué es permitido creer y cómo [el agente] debe permitirse revisar esas creencias a la luz de nueva información”3 (Peterson, 2009, p. 201). Esta formulación parece insinuar que la tarea de la teoría de establecer un conjunto de restricciones estructurales sobre el pensamiento del individuo es una tarea sencilla o de poca importancia. Sin embargo, la tarea de la teoría bayesiana de la decisión es de gran importancia porque elabora un modelo explicativo en el cual se establecen unas condiciones lógicas mínimas que deben cumplir las creencias y los deseos del individuo. Dicho de otra manera, en la teoría se elabora una estructura formal lo suficientemente poderosa para explicar las acciones de los agentes en cualquier situación determinada4 .
Ese conjunto de restricciones estructurales que establece la teoría bayesiana de la decisión se expresan en un conjunto de axiomas matemáticos que permiten la construcción de la escala de preferencias del agente, una función de probabilidad y una función de utilidad. Sobre este punto es importante tener en cuenta que al conjunto de axiomas se le entenderá como el marco de la racionalidad representado de manera matemática. Para entender esto con mayor precisión es necesario explicar los conceptos básicos de la teoría.

Preferencia, utilidad y probabilidad

En la teoría bayesiana de la decisión se utiliza el concepto de preferencia para explicar la conducta del agente frente a las opciones que se le presentan. Tal como se dijo en páginas anteriores, la preferencia de un agente se revela en la acción, es decir, se disfraza la acción como preferencia 5 . Esto quiere decir que en la acción se expresa la valoración del agente frente a las opciones que tenía. En otras palabras, la actitud de preferir una cosa sobre otra se expresa en la acción. Con el fin de explicar las preferencias de un agente, la teoría recurre a los conceptos de utilidad y probabilidad. El primero tiene como función representar de manera matemática los deseos de los agentes y el segundo las creencias del mismo. Por decirlo de alguna manera, la teoría disfraza al deseo con la utilidad y disfraza a la creencia con la probabilidad con el fin de explicar la acción disfrazada de preferencia. Esto quiere decir que la estructura formal de la teoría bayesiana de la decisión tiene tres componentes, a saber, la preferencia, la utilidad y la probabilidad.
Para un acercamiento a los conceptos de preferencia, utilidad y probabilidad, esta sección se encarga de explicar en rasgos generales cada uno de ellos, empezando por la explicación de la preferencia. En la escena que viene se empieza a elaborar la caracterización formal de los conceptos fundamentales de la teoría bayesiana de la decisión. Es decir, se establecen las características formales de los conceptos de preferencia, del deseo disfrazado como utilidad y de la creencia disfrazada como probabilidad. De esta manera, empieza a verse cómo se construye el escenario de esta obra.

La preferencia es una actitud comparativa de un individuo frente a dos prospectos u opciones. Dicho de otra manera, la preferencia es “el deseo tomado en su forma más fundamental como la relación de tres cosas: un agente y dos alternativas, una de las cuales es más deseada que la otra por el agente.” 6 (Davidson, 1984, p. 29). Esa actitud se manifiesta en las elecciones o acciones que realiza el agente, es decir, la preferencia se revela en las decisiones o acciones del agente. La definición técnica de la preferencia revelada recogida por Suzumura (2016) dice que un objeto o situación x es preferido a un objeto o situación y, si el agente escoge x cuando y también está disponible. Además, se dice que ese objeto o situación x se revela como preferido por el agente cuando no hay ninguna situación en la que, si está disponible ese objeto x, el agente escoja un objeto y. Dicho de otra manera, la preferencia es la que determina las acciones porque un agente actúa dependiendo de lo que prefiere según el presupuesto de racionalidad. Por ejemplo, si se le presentan a un agente dos opciones, una manzana x y una pera y, él elegirá el objeto que prefiera más, así sea tan solo un poco más que la otra, digamos que eligió la manzana x.

Esta relación de preferencia puede representarse de dos maneras, no propiamente matemáticas, pero sí simbólicas: cuando la preferencia es fuerte o estricta, se representa con el símbolo ” ≥” 7 y los objetos que relaciona están representados por letras como “x” y “y”. Cuando la preferencia no es estricta, es decir, cuando la preferencia es débil, se representa con el símbolo ” ≥” El caso mencionado el anterior párrafo puede simbolizarse como: 1. Cuando la preferencia es estricta: xy, 2. cuando la preferencia es débil xy 8.

Este punto es crucial. Determina que la estructura formal de la teoría está elaborada para explicar la preferencia en términos de creencia y deseo. Así pues, en la estructura es necesario que aparezca de manera formal la preferencia, en relación con las creencias y los deseos. De esta manera se establece que la estructura formal de la teoría bayesiana de la decisión está compuesta por los conceptos de creencia y deseo con el fin de explicar el concepto de preferencia.

Ahora bien, cuando se le presenta al agente un conjunto de prospectos, este los organiza u ordena. Por ejemplo, imaginemos un joven deportista de 17 años. Este se encuentra cursando su último grado de bachillerato y tiene que tomar una decisión con respecto a qué va a hacer después de graduarse. Las opciones que tiene el joven son las siguientes: 1) jugar a nivel profesional y no ir a la universidad (¬p ˄ u).9 . 2) No jugar a nivel profesional e ir a la universidad (¬p ˄ u). 3) Jugar a nivel profesional e ir a la universidad (¬p ˄ u), y 4) no jugar a nivel profesional y no ir a la universidad (¬p ˄ u). Este joven desea cumplir su sueño de jugar con los profesionales y cursar una carrera profesional. Por esa razón, en su ordenamiento de preferencias, la opción 3 (¬p ˄ u) debe tener la posición más alta, mientras que la opción contraria 4 (¬p ˄ u) tendría la posición más baja. Supongamos que prefiere un poco más cursar una carrera profesional que ser jugador profesional, de esta manera, la posición asignada a la opción 2 (¬p ˄ u) debe ser más alta que la posición de la opción 1 (¬p ˄ u) pero menor que la posición de la opción 3 (¬p ˄ u).
La ejemplificación anterior es meramente intuitiva. En realidad, para poder analizar las preferencias de un agente en la teoría de la decisión es necesario que estas cumplan dos criterios fundamentales, a saber, las preferencias deben ser consistentes y coherentes (Resnik, 1987, p. 49). La función de estas condiciones en términos matemáticos es mantener varias asimetrías en las preferencias del agente (Resnik, 1987, p. 50). Estas asimetrías son las que hacen posible elaborar un patrón de preferencias a partir de las acciones del agente, es decir, es la que hace posible considerar que la preferencia se revela en la acción (Sen, 1986, p. 73). Desde otro punto de vista, la función de estas condiciones, las cuales están expresadas en axiomas, es la de elaborar un marco normativo a partir del cual sea posible entender las preferencias. Esto quiere decir que la postulación de estos axiomas es caracterizar de manera formal el concepto de preferencia con el fin de elaborar una estructura formal para la teoría. Las condiciones son las siguientes 10 :

Condiciones ideales o axiomas de consistencia de las preferencias:
C.1. Si xPy entonces no yPx11
C.2. Si xPy entonces no xIy
C.3. Si xIy entonces ni xPy ni yPx
C.4. xPy o yPx o xIy12

Condiciones ideales o axiomas de transitividad de las preferencias:
C.5. Si xPy & yPz, entonces xPz
C.6 Si xPy & xIz, entonces zPy
C.7 Si xPy & yIz, entonces xPz
C.8 Si xIy & yIz, entonces xIz 13

Si las preferencias del individuo cumplen estas ocho condiciones en el momento de analizarlo, las consecuencias de las decisiones ordenadas en la escala de preferencias se dividen en clases de indiferencia. Una clase de indiferencia es un conjunto de objetos o situaciones que el agente considera igualmente satisfactorios para él. Al considerar que varios objetos o situaciones van a ser cada uno igual de placentero a los demás, el agente es indiferente ante estos. Por esa razón, es posible elaborar un conjunto que incluya esos objetos o situaciones que el agente considera igual de placenteros y ubicar ese conjunto en la escala de preferencias. Se utiliza el nombre “clase de indiferencia” por la indiferencia del individuo entre las consecuencias de su decisión, que son objetos o situaciones. De esta manera, afirmamos que el agente prefiere todas las consecuencias de la clase de indiferencia más alta sobre las consecuencias de las otras clases de indiferencia.
Por ejemplo, un individuo tiene cuatro posibilidades de postre a la hora del almuerzo, estas son: a) breva con arequipe, b) flan de vainilla, c) torta de chocolate y d) cheesecake de frutos rojos. El individuo organiza las opciones que tiene en clases de indiferencia de la siguiente manera: él prefiere la torta de chocolate más que los otros tres, esto lo ubicaría en la clase de indiferencia más alta. Por otra parte, en otra clase de indiferencia se encuentran el flan y el cheesecake, los cuales prefiere más que la breva con arequipe, ubicado en una clase de indiferencia más baja. Esto quiere decir que el individuo es indiferente al flan y al cheesecake porque estos se encuentran en la misma clase de indiferencia, pero prefiere estos dos a la breva porque esta se encuentra en una clase de indiferencia más baja.
La división de las consecuencias en clases de indiferencia es de gran importancia porque hace posible la construcción de una función de utilidad y de una escala de utilidad 14. En un principio, esta representación cuantificada del valor que llamamos la utilidad se decía que capturaba qué tanto placer o dolor traería una consecuencia de una decisión para un agente, esa era la interpretación que hacía Bentham de la utilidad. Sin embargo, hay situaciones en las que los deseos no buscan satisfacerse por placer sino por otras motivaciones. Por esa razón, interpretamos la utilidad como la representación matemática del deseo del agente de cada de una de las consecuencias que podría traer su decisión. Dicho de otra manera, “en la teoría de la decisión, los números que se refieren a las evaluaciones comparativas del valor [de las consecuencias] son comúnmente llamadas utilidades” 15 (Peterson, 2009, p. 23). Esto quiere decir que la utilidad es, por decirlo de alguna manera, la forma cuantificada de los deseos. Por tanto, las características formales del deseo y la utilidad son las mismas. Esto nos permite decir que disfrazamos al deseo con la utilidad para representarlo matemáticamente.
La secuencia de números que aparecen en la escala de utilidad es arbitraria, pueden usarse la secuencia de números 1-3 o 5-10 mientras se cumpla que el número mayor es asignado a la clase con mayor utilidad y las consecuencias a las cuales el individuo sean indiferente sean asignadas con el mismo número. Expresado matemáticamente, la utilidad de una clase se expresa con la función “u(x)” y las condiciones que debe cumplir la secuencia de números usados son las siguientes:

a. (u(x) > u(y)) ↔ (x≥y)16  

b.(u(x) = u(y)) ↔ (x∼y)17

De esta manera, la escala de utilidad que representa el ordenamiento del ejemplo anterior es la siguiente:
c)         Torta de chocolate                                                  [3]
b)         Flan de vainilla, d) Cheescake de frutos rojos          [2]
a)         Breva con arequipe                                                 [1]

Las escalas que cumplen con las condiciones a y b, tal como la anterior, son llamadas escalas ordinales de utilidad porque su única función es representar el ordenamiento de preferencias del agente. Por esa razón, la representación es bastante simple y no incluye un carácter matemático muy estricto. En esta escala no se representa de manera cuantitativa la información de las distancias que hay entre la preferencia de una consecuencia sobre otra. No obstante, a esta escala se le puede aplicar el proceso de transformación ordinal (Gilboa, 2010, p. 40). Esta transformación consiste en usar cualquier otro conjunto de números para representar el mismo ordenamiento de preferencias. Para que esta transformación sea exitosa debe cumplir las mismas condiciones que la original más una condición nueva:
c. (w≥v) ↔ (u’(w ≥u’(v)), para cada w y v en la escala u’.

Dicho de otra manera, la escala u’ debe cumplir la condición de que se mantenga el mismo ordenamiento entre los objetos, si el objeto w tiene una posición más alta en la escala u que el objeto v, en la transformación de esa escala se debe mantener que el objeto w tenga una posición más alta que el objeto v.
Existen otro tipo de escalas de utilidad que tienen la función de conservar más información acerca de las utilidades de un agente, estas son llamadas escalas cardinales de utilidad 18. A diferencia de las escalas ordinales, las escalas cardinales de utilidad reflejan acertadamente la diferencia de utilidad entre los objetos que están siendo medidos Peterson, 2009, pág. 25; Gilboa, 2010, pág.40). Esto quiere decir que representan precisamente de manera matemática la diferencia cualitativa que tiene para el agente el recibir uno u otro objeto, o el de estar en una situación determinada más bien que en otra como consecuencia de una decisión.
A estas escalas es posible aplicarles una transformación lineal positiva sin afectar la información que reflejan, “esto significa que cualquier escala de intervalo puede ser transformada en otra multiplicando cada entrada por un número positivo y sumándole una constante” 19 (Peterson, 2009, p. 26). Es decir que si tomamos una escala cardinal de utilidad, la podemos transformar en otra escala parecida que exprese la misma información con otra secuencia de números. Este proceso consiste en multiplicar cada constante de la escala por un número positivo y en sumar otro número o constante a ese resultado. Expresado matemáticamente, para una escala donde u(x) ≥ u(y) a la que se le aplique una transformación lineal positiva donde α>0, entonces u’(x) = α * u(x)+b˄ u’(y) = α*u(y +b. Por lo tanto: : (u(x ≥u(y)↔ (u’(x ≥u’(y)).

La inclusión del término “utilidad” permite reformular de manera más técnica el presupuesto central de la teoría de la decisión sobre la conducta del individuo. Ahora es posible afirmar que un individuo actúa de manera racional cuando busca maximizar su función de utilidad (Di Castro, 2009, p. 47). Aplicando esta definición sobre qué es actuar racionalmente a problemas donde un individuo tiene que tomar una decisión, es posible afirmar que tomar una decisión es solucionar un problema de maximización. Sin embargo, el término maximización puede no ser el adecuado. Este término parece querer decir que el individuo siempre va a actuar de manera que consiga mayores beneficios o utilidades, esto sin importar las circunstancias en las que se encuentre. Parece entonces implicarse de esa definición que el individuo podría tomar decisiones que son demasiado riesgosas y con poca probabilidad de ser exitosas. No obstante, actuar racionalmente es considerar los riesgos también y relacionarlos con las utilidades. Por esa razón, es mejor el término optimización. Así pues, la definición queda de esta manera: un individuo actúa de manera racional cuando busca optimizar su función de utilidad. Esto quiere decir que el individuo busca obtener la mayor utilidad posible teniendo en cuenta los riesgos a los que están sujetas sus decisiones.
La representación matemática de los deseos de un individuo, y la reformulación del presupuesto de racionalidad sobre la conducta del individuo muestra claramente una relación directa entre deseo y acción entendida como preferencia revelada, no solo de manera meramente intuitiva sino de manera formal y matemática. Esto justifica que una teoría que explique la acción como preferencia revelada considere como uno de sus conceptos centrales el de utilidad, y que este aparezca en la estructura formal de aquella teoría. En este caso, de una teoría bayesiana de la decisión.
El hecho de que sea posible representar las utilidades de un individuo de manera matemática, y que sea posible aplicar procesos como el de transformación lineal quiere decir que este concepto tiene unas características formales que permiten utilizarlo como parte de una estructura formal. Dicho de manera general, en esta sección se han relacionado la utilidad que puede traer una consecuencia o su deseabilidad con los estados del mundo u objetos que pueden ser consecuencias de una decisión, es decir, de una acción. Esto quiere decir que hemos desarrollado la idea de que un individuo actúa buscando el mayor beneficio posible. En otros términos, se elabora la idea de que el individuo actúa de la manera que mejor satisfaga sus deseos, como si partiera de una función de utilidad para actuar. Esta elaboración es la caracterización formal del concepto de deseo disfrazándolo con el concepto de utilidad.
Ahora bien, habiendo hecho un acercamiento a los conceptos de preferencia y de utilidad falta tratar el concepto de probabilidad, el disfraz que le pondremos a la creencia. Partamos de cuál es la función de la probabilidad en general. “El cálculo de probabilidades mide qué tan posible es que un evento (proposición) ocurra (sea verdadera)” 20 (Peterson, 2009, p. 299). Es clara la función de la probabilidad y cómo calcularla. No obstante, la naturaleza de la probabilidad ha sido fuertemente debatida por filósofos, estadísticos, y físicos, entre otros. “Algunos creen que la probabilidad es una medida de la fuerza o debilidad de nuestras creencias; otros piensan que es una propiedad de la realidad” (Resnik, 1998, p. 88). En otros términos, algunos defienden que la probabilidad es de naturaleza subjetiva y otros que es objetiva. Hagamos un breve recorrido por tres de las interpretaciones de la probabilidad y algunos de sus problemas con el fin de encontrar cuál es la interpretación que mejor se adecua a la teoría bayesiana de la decisión.
La primera interpretación es la clásica o laplaciana. Esta es de carácter objetivo y lógico. La tesis de esta interpretación es “que la probabilidad de un evento es una fracción del número total de posibilidades de cómo puede ocurrir el evento” 21 (Peterson, 2009, p. 134). Esta definición se expresa de manera matemática de la siguiente manera: P(a) = m/n 22. Para entender esto de mejor manera consideremos un ejemplo, imaginemos que yo tiro un dado de seis caras, según esta interpretación la probabilidad de que el número cuatro caiga bocarriba es de 1/6 porque sólo una de las caras del dado tiene el número cuatro en ella.
Esta interpretación tiene como presupuesto que los posibles casos considerados para el cálculo son igualmente probables. Tal como en el caso del lanzamiento de un dado se considera que es igualmente probable que caiga cualquiera de las seis caras, si el dado no está cargado. Esto quiere decir que los eventos o casos en los que se aplica la probabilidad deben cumplir dos características: deben ser definidos y finitos. La primera característica asegura que las posibilidades sean situaciones concretas, y la segunda asegura que esas posibilidades sean limitadas para que el cálculo de la probabilidad no incluya factores infinitos o indeterminados. Así pues, la interpretación clásica sirve para evaluar casos como un juego de cartas, y el lanzamiento de una moneda o de un dado.
Sin embargo, a esta interpretación le formularon dos grandes objeciones. La primera es que esta no puede asignar probabilidades a eventos singulares, eventos que solo ocurren una vez. Es decir que preguntas como qué tan probable es una tercera guerra mundial o qué tan probable es que salga un cinco al lanzar un dado cargado quedan sin respuesta, porque son casos donde los eventos no cumplen las características exigidas.
La segunda objeción es que esta interpretación carece de contenido empírico, “debido a que sus probabilidades son en última instancia proporciones entre posibilidades abstractas, un enunciado interpretado a la manera clásica no tiene implicaciones concernientes a los acontecimientos reales y no puede ser ni confirmado ni refutado por ellos.” (Resnik, 1998, p. 117). Por ejemplo, no es lo mismo lanzar una moneda en la tierra que en la luna. En la tierra la fuerza de la gravedad es una mientras que en la luna es otra. Este hecho podría afectar la probabilidad de que una moneda caiga cara o sello, sin embargo, según la interpretación clásica la probabilidad de que una moneda caiga cara siempre será 1/2.
La segunda interpretación que consideraremos surge como respuesta al problema de la carencia de contenido. Esta segunda interpretación caracteriza la probabilidad como una frecuencia relativa (Gilboa, 2010, p. 52). A diferencia de la interpretación clásica, esta es de carácter objetivo y empírico. La tesis de esta interpretación es “que la probabilidad de un evento es la proporción entre el número de veces que el evento ha ocurrido divido el número de casos observados”23 (Peterson, 2009, pág. 136). Expresado de manera matemática: P(a) = Total de instancias positivas/ Total de casos observados. Lo que esto quiere decir es que para encontrar la probabilidad de un evento, se llevan a cabo experimentos para definir un límite en la frecuencia con la que ocurre un evento. La interpretación hace dos suposiciones, la primera es que todos los experimentos se realizan bajo las mismas condiciones y segundo que los experimentos son independientes unos de los otros (Gilboa, 2010, p. 53). Por ejemplo, si lanzamos una moneda mil veces y cae veinte veces cara, eso querría decir que la probabilidad de que una moneda caiga cara es de 20/1000 o 0.02.
Esta interpretación debe lidiar con dos problemas: el primero es el posible cambio de las probabilidades de un experimento a otro. Retomemos el ejemplo anterior y supongamos que volvemos a lanzar la misma moneda otras mil veces, pero esta vez la moneda cae treinta veces cara, ¿este hecho indicaría que la nueva probabilidad es de 30/1000 a pesar de que la moneda usada es la misma y no hubo ninguna alteración física en el acontecimiento? Para solucionar este problema, la teoría de la probabilidad como frecuencia relativa toma un enfoque a largo plazo. Esto quiere decir que las frecuencias no se determinan llevando a cabo un solo experimento, sino que se espera que a largo plazo se llegue a un límite o frecuencia común. En el caso del lanzamiento de moneda se espera que, con el paso del tiempo y una gran cantidad de experimentos, la frecuencia relativa de que al lanzar una moneda caiga cara sea de 1/2.
El segundo problema es la imposibilidad de esta interpretación para asignar probabilidades a eventos singulares tales como la probabilidad de una tercera guerra mundial. La decisión teórica de tomar un enfoque a largo plazo para calcular las frecuencias relativas de los eventos cierra la posibilidad a esta teoría de asignar probabilidades a eventos singulares o únicos, simplemente porque estos no se repiten y por ello no se sabe a cuál frecuencia relativa estos van a tender. Sin embargo, intuitivamente los individuos asignamos probabilidades a muchos de estos eventos singulares en la vida diaria. Por ejemplo, cuando presentamos un examen le asignamos cierta probabilidad al evento de obtener una buena calificación.
Este problema de asignación de probabilidades a eventos singulares lo soluciona una interpretación subjetiva de la probabilidad. En esta la probabilidad es una buena herramienta para expresar de manera técnica las intuiciones de los agentes sobre la incertidumbre de que ocurran ciertos eventos (Gilboa, 2010, p. 55). La tesis “del enfoque subjetivo es que la probabilidad es un tipo de fenómeno mental. Las probabilidades no hacen parte del mundo externo, estas son entidades que los seres humanos crean de alguna manera en sus mentes”24 (Peterson, 2009, p. 143). Específicamente, la probabilidad es el grado de creencia o de confianza de un agente con respecto a que un evento ocurra o a que una proposición sea verdadera.
Dicho de otra manera, la probabilidad es un juicio que se emite acerca de qué tanta confianza tiene el agente sobre la realización de un evento o qué tanta confianza tiene el agente en la verdad de una proposición. Esto quiere decir que la creencia toma la forma de un grado de confianza. En otros términos, la creencia se disfraza de probabilidad subjetiva expresada en grados de confianza. Otra forma de explicarlo es decir que la probabilidad es qué tan dispuesto está el agente a apostar por una hipótesis sobre la verdad de una proposición o sobre que un evento sea el caso. Esta forma de explicar la creencia utiliza una situación donde se ponga a prueba el grado de confianza de un agente en una proposición o acerca de un evento. Por ejemplo, “si usted cree que su suministro de agua ha sido envenado, se resistirá a los intentos de hacerle beber, aunque esté muy sediento” (Resnik, 1998, p. 123). Otro ejemplo más cotidiano, es que si un hombre está enamorado de una mujer, pero cree que ella no gusta de él del mismo modo, ese hombre no estará dispuesto a declararle su amor a esa mujer por más enamorado que esté.
En esta interpretación los objetos en los que un agente cree son proposiciones, esto quiere decir que procedemos de la creencia completa en una proposición hasta la creencia parcial en otra (Ramsey, 1926, p. 163). Dicho de otra manera, una de las características formales de la creencia es que está determinada por un contenido proposicional. Entonces podemos pasar de creer en un contenido proposicional como verdadero a creer parcialmente en la verdad de otro contenido. De esta manera, cuando un agente asigna una probabilidad a un evento lo que quiere decir es que asigna una probabilidad a la verdad de una proposición. Por ejemplo, si un agente no quiere beber un vaso de agua porque cree que el agua está envenenada, lo que quiere decir es que el agente cree que la proposición “el agua de ese vaso está envenenada” es verdadera y por esa razón no beberá del agua.
De entrada, parece que el enfoque subjetivo tiene una cantidad de problemas que no puede superar, entre ellos la aparente imposibilidad de medir una creencia cuando esta es de carácter cualitativo. Parece que cuando hablamos de creencias y grados de creencia nos referimos a entidades psicológicas que van acompañadas de una sensación a la que llamamos grado de creencia. Si fuese de esta manera, parece que no hay manera de asignarle números a tales sensaciones.
No obstante, el matemático Frank Ramsey, uno de los precursores de este enfoque, no entiende la creencia como una entidad psicológica cuya sensación es el grado de creencia que queremos medir. Dicho brevemente, Ramsey (1926) entiende las creencias como una disposición a actuar y el grado de creencia como una propiedad causal de la creencia misma. Esto quiere decir que creer en una proposición es estar dispuesto a actuar con base en ella. Esa disposición puede someterse a prueba mediante un mecanismo de loterías. Dicho brevemente, se le proponen una serie de loterías al agente en las cuales están involucradas algunas proposiciones. Dependiendo de las decisiones que tome al agente con respecto a la falsedad o verdad de las proposiciones es posible encontrar su grado de confianza. Dicho de otra manera, a partir de las preferencias que se revelen en la toma de decisión de una lotería, es posible conocer el grado de confianza del agente en la proposición incluida en la lotería.
La interpretación subjetiva de la probabilidad es una herramienta para explicar la acción humana porque nos ayuda a representar cuantitativamente a las creencias. Esa la primera razón para defender que esta interpretación de la probabilidad es la que mejor se ajusta al propósito de este escrito. Esta interpretación permite una representación matemática de las creencias del individuo en una función de probabilidad subjetiva. A diferencia de las otras interpretaciones, esta relaciona la probabilidad con nuestro asunto, a saber, la acción humana. Nos ayuda a explicarla disfrazando a la creencia como probabilidad. Brindando así la posibilidad de matematizarla y elaborar una estructura formal que la incluya.
Por otra parte, esta interpretación de la probabilidad hace explícitas las características formales del concepto de creencia. La teoría de la probabilidad subjetiva tiene en su base un conjunto de axiomas. Estos axiomas determinan el marco o estructura que deben cumplir las creencias para poder representarlas en una función de probabilidad subjetiva. En otros términos, los axiomas representan las características formales del concepto de creencia las cuales permiten cuantificarlas. Otra característica formal que expone esta interpretación es la relación necesaria entre las creencias y el contenido proposicional de las mismas.
Además, la interpretación subjetiva pone en relación las creencias con la acción o preferencia revelada porque tiene base en la tesis de que las creencias son disposiciones a actuar. Esto quiere decir que para estudiar las creencias es necesario fijarse en las acciones de los agentes. Esto es evidente en la formulación técnica del presupuesto central de la teoría bayesiana de la decisión:
(Abre cita) cuando los bayesianos sostienen que los agentes racionales se comportan ‘como si’ actuaran a partir de una función de probabilidad subjetiva y una función de utilidad, esto quiere decir que las preferencias del agente con respecto a diferentes alternativas de acciones pueden ser descritas por un teorema de representación y un teorema de unicidad correspondiente; cada teorema con ciertas propiedades técnicas. 25 (Peterson, 2009, p. 205). (Cierra cita)
El hecho de que los individuos actúen ‘como si’ partieran de una función de probabilidad subjetiva y una función de utilidad, es lo que permite interpretar esta teoría como una que determina las características formales de los conceptos de creencia y deseo. Ahora veamos la teoría en funcionamiento.

La teoría en funcionamiento

En toda teoría bayesiana de la decisión hay tres elementos fundamentales involucrados en cualquier decisión que se vaya a analizar: acciones o actos (acts), estados del mundo (states) y consecuencias o resultados (outcomes) (Elster, 1986, p. 5). En la teoría se considera que “las acciones son meros instrumentos para conseguir consecuencias favorables y los estados son dispositivos necesarios para la aplicación de esos instrumentos” 26 (Peterson, 2009, p. 22). Para explicar esto retomemos el ejemplo de Resnik (1998), supongamos que yo entro en un garaje completamente oscuro que huele a gasolina, encuentro el interruptor de la luz y lo muevo varias veces. La luz no prende así que empiezo a considerar la idea de prender uno de los fósforos que llevo en mi bolsillo, pero dudo en hacerlo porque sé que si hay suficiente gasolina en el ambiente podría causar una explosión.
Las acciones que estoy considerando son dos: prender el fósforo o no prenderlo. Estas pueden traer dos consecuencias a partir del estado del mundo en esa situación: que haya explosión o que no la haya. Cabe aclarar que las consecuencias (outcomes) son de carácter comprehensivo, es decir, incluyen más información de lo que se menciona en la tabla (Peterson, 2009, p. 23). Esto se muestra en el ejemplo: el hecho de que consideremos que las consecuencias son que haya una explosión o no lo haya, incluye el hecho de que si hay explosión todo lo que hay dentro del garaje se destruya o que, si no estalla, todo lo que hay quede intacto.
A cada una de las consecuencias posibles se les asigna una utilidad. Si decido no prender el fósforo solo habrá una consecuencia, que no haya una explosión. En cambio, si decido prender el fósforo hay dos consecuencias posibles, que haya explosión o que no la haya. Con estos datos se construye una tabla de decisión para evaluar la situación. En esta, las acciones ocupan los lugares de las filas y los estados del mundo las columnas, mientras que las consecuencias van dentro de cada cuadro de la tabla, acompañadas por la probabilidad y la utilidad que se le asigne a cada una.

Tabla 1. Una decisión explosiva


Estados del mundo Acciones

Niveles peligrosos de gasolina en el ambiente

Niveles no peligrosos de gasolina en el ambiente

Prendo el fósforo

Explosión
U(a) = - 1000
P(a) = ½

No explosión
U(c) = 100
P(b) = 1/2

No prendo el fósforo

No explosión
U(b) = 0
P(c) = 1

No explosión
U(b) = 0
P(c) = 1

Fuente: elaboración propia

Con estos datos elaboramos una operación sencilla. En esta multiplicamos la utilidad de cada consecuencia con su probabilidad para encontrar la utilidad final. De esta manera determinamos cuál es la acción racional que deberíamos llevar a cabo. Por ejemplo, si realizo los cálculos de cada uno de los cuadros queda claro que el mejor caso posible es si prendo el fósforo y no hay una explosión. Sin embargo, tengo que considerar si el riesgo de explosión es demasiado alto. Así las cosas, yo decido no prender el fósforo porque considero la probabilidad de una explosión demasiado alta.
El funcionamiento de la teoría, a grandes rasgos, consiste en presentarle al agente el conjunto de opciones que tiene, cuáles son los riesgos y cuáles los beneficios que cada una de las decisiones podría traerle. Esto no quiere decir que la teoría tenga la pretensión de obligar al agente de actuar de una manera determinada. Más bien, busca exponer cuál podría ser la mejor opción para él. En mi caso pude haber prendido el fósforo, puesto que esto traía las mayores utilidades. Sin embargo, desde mi punto de vista, el riesgo de una explosión que acabara con mi vida era demasiado alto. Otro agente pudo optar por prender el fósforo independiente del riesgo que hubiese.
La explicación de los rasgos generales, los conceptos básicos y mostrar la teoría funcionamiento nos deja un panorama general sobre la teoría bayesiana de la decisión y su funcionamiento. Para posterior desarrollo es necesario investigar las diferentes teorías y sus aspectos técnicos con el fin de encontrar dónde divergen y por cuáles razones. Ese estudio nos brindará el conocimiento de las consecuencias que tiene la teoría en su funcionamiento. Veamos algunos de los problemas que esta teoría debe enfrentar.

Apéndice: los problemas clásicos que enfrenta una teoría bayesiana de la decisión

Determinar qué conjunto de acciones, estados del mundo y consecuencias se van a tener en cuenta para construcción de la tabla se llama la especificación del problema. Este proceso de especificación del problema es de gran importancia para los teóricos de la decisión, pues hay casos en los que ignorar alguna consecuencia o no describir los estados del mundo de manera suficientemente detallada puede llevar a tomar una decisión que tenga consecuencias trágicas. Por ejemplo, imaginen que una empresa farmacéutica toma la decisión de lanzar al mercado un producto llamado “la heroína de las mamás”, este se supone debe curar los constantes casos de gripe común en los niños. Los científicos que decidieron lanzar al mercado este producto solo tuvieron en cuenta dos posibles consecuencias, curaban la mayoría de los casos de gripe común o su medicamento no tenía efecto alguno. No tuvieron en cuenta la consecuencia que efectivamente ocurrió, los niños se volvieron adictos al producto por la alta cantidad de opiáceos que este contenía y tuvieron que quitarlo del mercado de inmediato. Para que casos como el de este ejemplo no ocurran, la especificación del problema debe ser definida y completa. Estas dos características se cumplen cuando los estados del mundo son mutuamente excluyentes y exhaustivos, es decir, cuando abarcan todas las posibilidades y no pueden estar sucediendo dos de ellos simultáneamente (Resnik, 1998, p. 28).
El segundo problema es de carácter filosófico. Este consiste en que quien utilice la teoría para analizar una decisión quedaría atrapado en una regresión al infinito en ese proceso. Esto ocurre porque si en primera instancia se va a construir una tabla de decisión para evaluar las posibilidades de acción, es necesario tomar decisiones sobre qué actos, estados y resultados van a ir incluidos en ella; en segunda instancia se necesita construir otra tabla de decisión para tomar esa decisión y así de manera consecutiva hasta el infinito. Para solucionar este problema, Resnik (1998) postula que para la construcción de tablas de decisión se toman decisiones inmediatas, es decir, decisiones que no necesitan de un gran análisis.
A partir de esa solución surge un tercer problema: ¿son las decisiones inmediatas racionales o no? Parece que no lo serían porque no están tomadas por una deliberación que nos conduzca a obtener los mayores beneficios posibles de una acción. No obstante, no todas las situaciones que ocurren en nuestras vidas deben ser analizadas a partir de la teoría de la decisión racional. Por ejemplo, si estamos cruzando una calle y vemos un auto acercarse a toda velocidad, si nos detenemos a pensar hacia cuál de los dos lados de la calle movernos probablemente seamos atropellados. Dice Resnik (1998) que: “vivimos conforme a muchas reglas de conducta que nos dicen cuándo deberíamos tomar una decisión inmediata y cuándo necesitamos un análisis de la decisión de algún tipo. Algunas de estas reglas son más racionales que otras, porque nos permiten, en general, vivir mejor.” (Resnik, 1998, p. 34).
Otro problema que puede surgir en el análisis de una decisión puede ser la descripción de los estados del mundo, algunas veces estas descripciones contienen enunciados como “tomé la decisión correcta” o “las cosas salieron bien” (Resnik, 1998, p. 35). Estos enunciados hacen inadecuada la descripción de los estados del mundo por dos razones: en primer lugar, si ya se conoce la decisión correcta no es necesario deliberar sobre cuál es la decisión correcta; en segundo lugar, las descripciones de estados del mundo futuros siempre son inciertas. Entonces, enunciados como “las cosas salieron bien” simplemente no funcionan, porque nadie sabe si las cosas van a salir bien para que su decisión le traiga las consecuencias deseadas al agente. Lastimosamente no hay un método que nos asegure que las descripciones de los posibles estados del mundo sean adecuadas o no.
En el párrafo anterior se dijo que si ya se conoce la decisión correcta no es necesario hacer un proceso de deliberación. No obstante, es necesario no confundir decisiones correctas y decisiones racionales; las decisiones racionales no son siempre las decisiones correctas. Por ejemplo, supongamos que hay dos competidores en la industria de importación de bebidas alcohólicas llamados Eduardo y Santiago. Sus compañías tienen igual balance financiero. Una compañía extranjera les ofrece la oportunidad a ambos de ser los primeros en importar una bebida llamada “Colomboschnaps” por una determinada suma de dinero. Eduardo contrata a un analista en toma de decisiones para que le diga si es una buena decisión pagar el dinero que la compañía pide por la importación de su nuevo producto, mientras que Santiago decide lanzar una moneda al aire para tomar la decisión.
Después de una larga investigación de las finanzas de la compañía de Eduardo, y de un análisis de mercado sobre bebidas alcohólicas, el analista le aconseja que no invierta en ese negocio porque el riesgo de que el producto no sea exitoso es muy alto, por tanto, no es una decisión racional dadas las circunstancias. Por otra parte, Santiago invirtió en el negocio a partir del resultado de su lanzamiento de moneda. Para sorpresa de todos, el producto es un éxito y Santiago se volvió multimillonario a causa de su decisión. De esta manera, se entiende que Santiago tomó la decisión correcta. Una decisión se considera correcta cuando da lugar a consecuencias que los individuos consideran al menos tan satisfactorios como cualquier otra consecuencia posible que podría haber traído esa decisión (Cfr. Resnik, 1998, p. 35). En cambio, Eduardo tomó la decisión racional, es decir, la que mejor se ajustaba a las consecuencias esperadas por él, según el análisis del teórico de la decisión que contrató 27.
Existen otros problemas que la teoría debe enfrentar. El fin de estas palabras era exponer de manera general algunos de los problemas clásicos.

Referencias

  1. Bossert, W. & Suzumura, K. (2010) Consistency, Choice and Rationality. Londres, Inglaterra: Harvard University Press.
  2. Davidson, D. (1984) “Expressing Evaluations”, en Davidson, D. (2004) Problems of Rationality: págs. 19-38. Nueva York, Estados Unidos de América: Oxford Clarendon Press Inc.
  3. Davidson, D. (1990) “Estructura y contenido de la verdad”, en Nicolás, J. y Frápoli, M. (eds.) (trad.) (1997) Teorías de la verdad en el siglo XX: págs.146-206. Madrid, España: Técnos.
  4. Di castro, E. (2009) La razón desencantada. Un acercamiento a la teoría de la decisión racional. Ciudad de México, México: Universidad Nacional Autónoma de México.
  5. Elster, J. (ed) (1986) Rational Choice. Nueva York, Estados Unidos de América: New York University Press.
  6. Gilboa, I. (2010) Rational Choice. Londres, Inglaterra: The MIT Press.
  7. Peterson, M. (2009) An Introduction to Decision Theory (Cambridge Introductions to Philosophy). Londres, Inglaterra: Cambridge University Press.
  8. Ramsey, F. (1926). “Verdad y probabilidad”, en Marín, J. & Frápolli, M. (2004) Frank Ramsey obra filosófica completa. págs: 147-186. Granada, España: Editorial Comares.
  9. Resnik, M. (1987). Choices. An Introduction to Decision Theory. Minnesota, Estados Unidos de América: University of Minnesota Press.
  10. Resnik, M. (1998). Elecciones: una introducción a la teoría de la decisión. Barcelona, España: Gedisa.
  11. Steele, Katie & Stefánsson, H. Orri, "Decision Theory", The Stanford Encyclopedia of Philosophy (Winter 2016 Edition), Edward N. Zalta (ed.), URL = <https://plato.stanford.edu/archives/win2016/entries/decision-theory/>.
  12. Suzumura, K. (2016) Choice, Preferences and Procedures, a Rational Choice Theoretic Approach. Cambridge, Estados Unidos de América: Harvard University Press.

* Este artículo de reflexión es el resultado de la realización de un trabajo de grado para optar al título de Filósofo de la Pontificia Universidad Javeriana.

** Filósofo de la Pontificia Universidad Javeriana. Profesional Soporte de la Unidad de Investigación de la Universidad Santo Tomás. Correo electrónico: cuevasn@outlook.es, prof.sopunidadinvestigacion@usantotomas.edu.co. Número Orcid 0000-0002-6241-2188

Esta posición tiene como presuposición, al menos en economía, que la preferencia del individuo se expresa en las acciones. Dicho de manera más técnica, la preferencia se revela en la acción tal como Samuelson (1973) lo propuso. Esto quiere decir que cuando un individuo actúa revela cuál era su deseo, qué quería conseguir en esa situación específica. Por ejemplo, si vemos a un hombre comprar un helado de mora, podría decir que, en esa situación, prefiere el helado de mora sobre los helados de otros sabores. Esta suposición se hace con el fin de elaborar una teoría en la que no se presuponga conocimiento de los estados mentales del agente que actúa pero que parta de una evidencia que sea suficiente pero no detallada para poder asignar algún contenido a esos estados mentales (Bossert & Suzumura, 2010, p. 20). Dicho de otra manera, esta suposición tiene la función de brindarnos una evidencia a partir de la cual trabajar para poder explicar la acción del individuo sin presuponer que conocemos cuáles son los deseos y las creencias específicas del agente que vamos a analizar en una situación determinada.

Existen otras teorías de la decisión que no son normativas. Los científicos sociales que han desarrollado teorías de la decisión tienen por objetivo hacer una descripción de cómo toman decisiones individuos o grupos, es decir, no investigan cómo deberían tomar decisiones los individuos, sino que buscan investigar cómo fácticamente toman decisiones los individuos. Por esa razón, se les ha llamado teorías descriptivas de la decisión. Jhon Elster (1986) formula que una limitación fuerte de este tipo de teorías es que no tienen ningún potencial explicativo de las acciones de los individuos que toman por objeto porque no consideran la relación entre creencias y deseos como una relación causal que explica la acción. Cabe aclarar que esta clasificación de las teorías no es de carácter rígido, porque para las llamadas teorías normativas tiene una gran importancia el fenómeno de cómo toman decisiones los individuos para la prescripción de cómo deberían tomar decisiones. Según Di Castro (2009), existe un tercer enfoque que no tiene la pretensión de ser ni normativo ni descriptivo, este enfoque busca un modelo explicativo a partir de un recurso hipotético sobre la conducta de los individuos racionales. En este tipo de enfoque, las teorías introducen el concepto de hombre económico (rational economic man) u hombre perfectamente racional. El recurso hipotético que utilizan es la misma hipótesis mencionada sobre la conducta del individuo.

La traducción es propia, la cita original dice: “The theory merely provides a set of structural restrictions on what is permissible to believe, and how one should be permitted to revise those believes in light of new information.” (Peterson, 2009, p. 201).

La situación determinada en la que se van a evaluar los agentes en este escrito es una en la cual el individuo no tiene información completa sobre la situación y sobre cuáles serían las consecuencias de la misma. Este es un criterio que determina una teoría de la decisión. Existen teorías donde el agente toma decisiones teniendo la información completa sobre cuáles serán las consecuencias de sus acciones. Sin embargo, hay muchas situaciones donde el individuo no tiene la información completa. Las teorías de la decisión de ese tipo, como la que se presenta en este escrito, se llaman teorías de la decisión para situaciones de incertidumbre o riesgosas (Resnik, 1984; Peterson, 2009; Gilboa, p. 210).

La preferencia se entiende como deseo en el sentido más básico del mismo, en ese deseo se encuentra de alguna manera incrustada o contenida una creencia. Esto quiere decir que la preferencia es un estado mental, una configuración entre una creencia y un deseo. No obstante, se considera el deseo como lo más básico en el que está incrustada una creencia porque si conocemos lo suficientemente los deseos de un agente, es posible deducir lo que cree, mientras que al revés no es posible. (Davidson, 1984, p. 29).

La traducción es propia, la cita original dice: “Desire is taken in its fundamental form as a relation between three things: an agent, and two alternatives, one of which is desired more strongly than the other but the agent” (Davidson, 1984, p. 29).

Esta simbolización es tomada del artículo “Decision Theory” (Steele, K. & Stefanson, 2016).

En este artículo las preferencias se formalizarán con el signo de preferencia débil.

En este escrito la conectiva lógica de la conjunción será representada simbólicamente así “^” y la operación de negación será representada simbólicamente así “¬”.

Al ser la preferencia una relación que se aplica a dos alternativas, la formalización de esta debe tener las características de simetría, reflexividad y transitividad. Además, debe tener la característica de completud. En este escrito tan solo se tratan los axiomas de completud y transitividad.

Las variables x, y, z, etc., hacen referencia a las consecuencias de una decisión. La notación xPy significa que el individuo prefiere x sobre y. Mientras que, la notación xIy significa que el individuo es indiferente con respecto a ambas. En teoría de la decisión ser indiferente con respecto a dos posibilidades significa que, después de analizar las posibilidades, el individuo está dispuesto a cambiar una por otra. (Resnik, 1998. p. 50).

Esta condición asegura que todas las posibles consecuencias de la decisión que el agente considere estén ordenadas dentro de la escala de preferencias. Dicho de otra manera, esta condición asegura que la escala de preferencia esté completa.

Las condiciones 5-8 aseguran la transitividad de las preferencias del individuo. Sin embargo, estas condiciones no siempre las cumplen los individuos reales, algunas veces los individuos fallan en la transitividad de sus preferencias y caen en algún tipo de estafa. Por ejemplo, imaginemos que presenciamos un experimento donde se quieren confirmar que al menos un individuo cumple con estas condiciones ideales o normativas. El experimento consiste en hacer que el individuo pruebe 8 tazas llenas de café con diferentes cantidades de azúcar. Vemos que después de beber el contenido de las tazas el individuo afirma que prefiere la taza cuyo café tenía mayor cantidad de azúcar y que el último en su ordenamiento de preferencias era el café sin azúcar. En cuanto al ordenamiento del resto de opciones, el individuo afirma que prefería el contenido de la taza 6 que el de la taza 5. Con esos resultados, se vuelve a realizar el experimento con una leve diferencia, sin que el individuo lo note se intercambian de sitio las tazas 5 y 6. Al final de la repetición del experimento el individuo afirma una vez más que prefiere el café de la taza 6 que el de la 5. No obstante, lo que el individuo no sabe es que la diferencia de azúcar del café de la taza 5 y el de la taza 6 no es perceptible por el ser humanos.

Existe una diferencia entre escalas de utilidad y funciones de utilidad. Las escalas de utilidad son las secuencias de números usados en los ordenamientos de las preferencias y las funciones de utilidad son las formas de relacionar números con esos ordenamientos.

La traducción es propia, el texto original dice: “In decision theory, numbers referring to comparative evaluations of value are commonly called utilities” (Peterson, 2009, p. 23).

Para representar simbólicamente la conectiva lógica “si y solo si” utilizamos el signo “↔ ”.

En la formalización de los axiomas o condiciones que debe cumplir la secuencia de números para que estos representen los deseos de los agentes, hay una relación relevante para la estructura formal de la teoría. En estos axiomas se encuentran relacionados el signo de preferencia débil “http://economiau.freehostia.com/images/stories/microOld/preferidoDebilmenteA.gif” y el signo de indiferencia “∼”, con el signo matemático que representa la relación mayor que con el símbolo “<”. Esto indica que podemos expresar las preferencias de manera matemática con tal símbolo. El argumento que soporta este razonamiento incluye las relaciones formales que tienen la estructura cualitativa de la preferencia y la estructura matemática de la escala de utilidad.

Las escalas cardinales pueden ser de dos tipos: 1) escalas de intervalo y 2) escalas de proporción. Las primeras reflejan la diferencia de utilidad entre dos objetos de una escala y las segundas reflejan las diferencias de proporción entre dos objetos. Sin embargo, en este escrito cuando se hable de escalas de utilidad, se entenderá que se trata de una escala de intervalo.

La traducción es propia, la cita original dice: “This means that any interval scale can be transformed into another by multiplying each entry by a positive number and adding a constant” (Peterson, 2009, p. 26).

La traducción es propia, el texto original dice: “The probability calculus measures how likely an event (proposition) is to occur (is to be true).” (Peterson, 2009, p. 299).

La traducción es propia, la cita original dice: “holds the probability of an event to be a fraction of the total number of possible ways in which the event can occur.” (Peterson, 2009, pág. 134)

En esta formalización el símbolo “P(a)” significa la probabilidad de que un evento A ocurra o de que una proposición sea verdadera, dependiendo de la interpretación de la probabilidad que se aplique. Mientras que las letras “m” y “n” representan números reales que expresan una proporción.

La traducción es mía, el texto original dice: “holds that probability of an event is the ratio between the number of times the event has ocurred divided by the total number of observed cases” (Peterson, 2009, pág. 136)

La traducción es propia, la cita original dice: “The main idea in the subjective approach is that probability is a kind of mental phenomenon. Probabilities are not part of the external world; they are entities that human beings somehow create in their minds.” (Peterson, 2009, p. 143). 

La traducción es propia, la cita original dice: “when Bayesians claim that rational decision makers behave ‘as if’ they act from a subjective probability function and a utility function, and maximise subjective expected utility, this is merely meant to prove that the agent’s preferences over alternative acts can be described by a representation theorem and a corresponding uniqueness theorem, both of which have certain technical properties.” (Peterson, 2009, p. 205).

La traducción es mía, la cita original dice: “Acts are mere instruments for reaching good outcomes, and states are devices needed for applying these instruments.” (Peterson, 2009, p. 22).

Este ejemplo muestra de manera intuitiva que “actuar es un juego de azar porque nunca sabremos cuáles son las consecuencias de nuestras acciones.” (Davidson, 1990, p. 190). Así, pues, tal como en el ejemplo anterior, actuar racionalmente no asegura que las decisiones tomadas a partir de un análisis racional de la decisión sean las correctas. “Aun así, nuestras elecciones deberían estar basadas tanto en la información que tenemos a nuestro alcance, como en una estimación precisa de los riesgos asociados, puesto que ésta es claramente la única aproximación racional a la toma de decisiones.” (Resnik, 1998, pág. 35).