Dilema del Prisionero
Dilema del Prisionero
[editar | editar código]| Archivo:Dilema-prisionero-demarquia.png | |
| Disciplina | Teoría de Juegos |
|---|---|
| Tipo de juego | No cooperativo, suma cero/negativa |
| Formulado por | Merrill Flood y Melvin Dresher (1950) |
| Nombre dado por | Albert W. Tucker |
| Concepto clave | Equilibrio de Nash subóptimo |
| Problema central | Racionalidad individual → irracionalidad colectiva |
| Resolución tradicional | Juegos repetidos, reputación, castigo |
| Resolución demárquica | Modificación de la matriz de pagos |
| Estrategia en capitalismo | Defección (competir/traicionar) |
| Estrategia en Demarquía | Cooperación (egoísmo ilustrado) |
El Dilema del Prisionero es un concepto fundamental de la Teoría de Juegos que ilustra cómo el egoísmo racional individual conduce a un resultado subóptimo para el colectivo.
En el contexto de la Demarquía Planetaria, el sistema está diseñado precisamente para resolver y anular este dilema mediante la Arquitectura de Incentivos Inteligentes y el principio del Egoísmo Ilustrado.
Introducción
[editar | editar código]El Dilema del Prisionero es el ejemplo más famoso de cómo la racionalidad individual puede conducir a la irracionalidad colectiva. Es la demostración matemática de por qué sociedades de individuos racionales pueden colapsar en competencia destructiva, desconfianza mutua y miseria compartida.
La Demarquía argumenta que el sistema actual es inherentemente defectuoso porque incentiva al Homo Debitum (el humano endeudado) a adoptar el egoísmo dañino como la estrategia más racional para la supervivencia.
"El Dilema del Prisionero se resuelve cuando el diseñador del juego, en lugar de castigar al jugador por ser racional, inclina el campo de juego de tal manera que el camino más fácil y rápido para alcanzar la meta individual es, inherentemente, el camino que beneficia a todos. Es el camino de menor resistencia (Principio de Mínima Acción) conduciendo al bien común."
1. El Dilema Clásico
[editar | editar código]Formulación Original
[editar | editar código]Dos criminales son arrestados y interrogados en celdas separadas. La policía les ofrece el siguiente trato:
Opciones:
- Si ambos cooperan (guardan silencio): 1 año de cárcel cada uno
- Si ambos traicionan (confiesan): 3 años de cárcel cada uno
- Si uno traiciona y el otro coopera: El traidor sale libre (0 años), el cooperador recibe 5 años
Matriz de Pagos
[editar | editar código]| Prisionero B | |||
|---|---|---|---|
| Cooperar | Traicionar | ||
| Prisionero A | Cooperar | A: -1, B: -1 (óptimo colectivo) |
A: -5, B: 0 (A es explotado) |
| Traicionar | A: 0, B: -5 (B es explotado) |
A: -3, B: -3 (equilibrio de Nash) | |
Análisis Estratégico
[editar | editar código]Razonamiento del Prisionero A:
- "Si B coopera, yo gano más traicionando (0 años vs 1 año)"
- "Si B traiciona, yo gano más traicionando (3 años vs 5 años)"
- Conclusión: Traicionar es mi estrategia dominante
Razonamiento del Prisionero B: (idéntico)
Resultado: Ambos traicionan → Ambos obtienen 3 años (subóptimo)
Paradoja: La racionalidad individual produce irracionalidad colectiva
2. El Dilema en el Sistema Actual
[editar | editar código]El Dilema del Prisionero no es solo un experimento mental abstracto. Es la estructura profunda de la mayoría de las interacciones bajo el capitalismo.
Manifestaciones en el Capitalismo
[editar | editar código]| Contexto | "Cooperar" | "Traicionar" | Equilibrio (subóptimo) |
|---|---|---|---|
| Competencia empresarial | Respetar regulaciones ambientales | Contaminar para reducir costos | Todos contaminan (destrucción ambiental) |
| Mercado laboral | Pagar salarios justos | Explotar trabajadores | Carrera hacia el fondo (salarios mínimos) |
| Sistema financiero | Invertir en economía real | Especular en derivados | Todos especulan (crisis financieras) |
| Política | Colaborar por bien común | Favorecer lobby que te financia | Todos favorecen lobbies (captura regulatoria) |
| Carrera armamentística | Desarme mutuo | Aumentar arsenal | Todos se arman (gasto militar masivo) |
| Uso de recursos comunes | Uso sostenible | Sobreexplotación | Tragedia de los Comunes |
Por Qué el Capitalismo Perpetúa el Dilema
[editar | editar código]Características del capitalismo que mantienen el dilema:
- Psicología de la escasez: Si alguien gana, otro pierde (juego de suma cero)
- Falta de mecanismos de coordinación: No hay forma de garantizar cooperación mutua
- Horizonte temporal corto: Empresas priorizan ganancias trimestrales sobre sostenibilidad
- Externalización de costos: Puedes traicionar (contaminar, explotar) sin pagar las consecuencias completas
- Asimetría de información: No sabes si el otro cooperará
- Falta de reputación vinculante: Puedes traicionar y luego cambiar de identidad corporativa
Ejemplo Concreto: Salarios en Competencia
[editar | editar código]Dilema de las empresas:
Dos empresas compiten. Pueden pagar salarios justos o bajos.
Matriz de pagos:
- Si ambas pagan bien: Beneficio medio, sociedad próspera (óptimo colectivo)
- Si ambas pagan mal: Beneficio medio, sociedad empobrecida (equilibrio de Nash actual)
- Si una paga bien y otra mal: La que paga mal tiene ventaja competitiva y expulsa del mercado a la que paga bien
Resultado: Carrera hacia el fondo. Traicionar (pagar mal) es estrategia dominante.
Consecuencia sistémica: Empobrecimiento general, demanda agregada baja, crisis económicas recurrentes.
3. El Objetivo Demárquico: De Suma Cero a Suma Positiva
[editar | editar código]La solución demárquica no es luchar contra el egoísmo, sino modificar la matriz de pagos del juego social para que la cooperación sea siempre la estrategia dominante.
La arquitectura demárquica transforma la dinámica social, haciendo que el bienestar ajeno sea una garantía del bienestar propio.
Transformación de la Matriz
[editar | editar código]| Aspecto | Capitalismo (Suma Cero) | Demarquía (Suma Positiva) |
|---|---|---|
| Naturaleza del juego | Tu ganancia = mi pérdida | Tu ganancia = mi ganancia (AU50) |
| Estrategia dominante | Traicionar (competir) | Cooperar (colaborar) |
| Equilibrio de Nash | Ambos traicionan (subóptimo) | Ambos cooperan (óptimo) |
| Consecuencia de traición | Ganancia a corto plazo | Pérdida de CdC = suicidio estratégico |
| Horizonte temporal | Corto (trimestral) | Largo (siglos con longevidad extendida) |
| Información | Asimétrica, opaca | Simétrica, transparente (blockchain) |
| Reputación | Débil, no vinculante | Fuerte, permanente (CdC) |
Nueva Matriz de Pagos Demárquica
[editar | editar código]| Ciudadano B | |||
|---|---|---|---|
| Cooperar | Traicionar | ||
| Ciudadano A | Cooperar | A: +10, B: +10 (AU50 + DP + CdC alto) Estrategia dominante |
A: +5, B: +3 (A obtiene DP, B pierde CdC) |
| Traicionar | A: +3, B: +5 (A pierde CdC, B obtiene DP) |
A: -5, B: -5 (Ambos pierden CdC) Equilibrio inestable | |
Análisis:
- Cooperar/Cooperar ahora da la mayor recompensa (+10, +10)
- Traicionar tiene un costo severo (pérdida de CdC) que supera cualquier ganancia a corto plazo
- La estrategia dominante se invierte: Cooperar es ahora óptimo
- El equilibrio de Nash coincide con el óptimo de Pareto
4. Mecanismos que Anulan la Defección
[editar | editar código]Varios pilares de la Demarquía trabajan en conjunto para garantizar que la cooperación sea la estrategia óptima a largo plazo, desactivando el Dilema del Prisionero.
A. Asociación Universal al 50% (AU50)
[editar | editar código]El AU50 garantiza que la sociedad (el Fondo Común) aporte el 50% del capital y reciba el 50% de las ganancias.
Alineación de Beneficios:
Si un ciudadano tiene éxito en un proyecto, ese valor entra en el Fondo Común y se redistribuye a todos los ciudadanos a través del Dividendo Planetario (DP).
Si tu socio (el Fondo Común, es decir, el resto de la humanidad) prospera, tú prosperas automáticamente.
Esto convierte el juego en suma positiva: Tu éxito me beneficia literalmente porque recibo mi parte del DP.
Alineación de Riesgos:
Si un proyecto fracasa honestamente, la sociedad absorbe su mitad del golpe. Esto elimina el miedo existencial al riesgo, lo que permite a los individuos asumir riesgos productivos (innovar) sin ser aplastados por la deuda en caso de fallar.
Esto hace que la opción de colaborar y crear sea inherentemente más segura que la opción de aislarse o acaparar.
Efecto en la matriz:
| Sin AU50 | Con AU50 |
|---|---|
| Si colaboro y tú ganas → Yo no gano nada | Si colaboro y tú ganas → Yo gano automáticamente (vía DP) |
| Si colaboro y fallo → Pierdo todo | Si colaboro y fallo → Pierdo solo 50% (sociedad absorbe el resto) |
| Incentivo: No colaborar (riesgo asimétrico) | Incentivo: Colaborar (riesgo compartido, ganancia compartida) |
B. Capital de Confianza (CdC) y la Longevidad
[editar | editar código]El Dilema del Prisionero es más difícil de resolver en un juego de una sola interacción o cuando el horizonte temporal es corto. La Demarquía lo transforma en un juego repetido con consecuencias permanentes.
Reputación como Activo Principal:
El CdC mide la integridad y la competencia. En un sistema donde la longevidad se extiende potencialmente por siglos, la pérdida de CdC por fraude se convierte en un suicidio estratégico.
Análisis de largo plazo:
- Traicionar una vez: Ganas 10.000€ hoy
- Perder CdC: Pierdes acceso a oportunidades por 250 años
- Valor presente neto de oportunidades perdidas: Millones de euros
Conclusión: La traición es económicamente irracional incluso para el más egoísta.
Costo de la Deshonestidad:
El fraude se paga mucho más caro que el fracaso honesto. La honradez deja de ser una virtud moral para ser la estrategia económicamente óptima.
Esto desalienta la defección inmediata, ya que el beneficio a corto plazo se borra por la pérdida de reputación a largo plazo.
Efecto en la matriz:
| Sin CdC | Con CdC + Longevidad |
|---|---|
| Traicionar puede ser rentable si no te pillan | Traicionar destruye tu CdC permanentemente |
| Horizonte temporal: ~30 años productivos | Horizonte temporal: ~300 años productivos |
| Valor de reputación: Limitado | Valor de reputación: Órdenes de magnitud mayor |
| Incentivo: Arriesgar traición | Incentivo: Preservar reputación a toda costa |
C. Oxidación Selectiva (Demurrage)
[editar | editar código]La Oxidación Monetaria penaliza el capital líquido inactivo (ej: 1% mensual), obligando a invertir por puro interés propio.
Incentivo contra el Acaparamiento:
Si el dinero se estanca, se evapora. Esto obliga a los individuos, por puro egoísmo, a poner el capital a trabajar en proyectos productivos, invertir en el MIR, o prestarlo al Fondo Común.
Fin de la Ganancia por Inacción:
Elimina el beneficio por acaparamiento (una forma de defección económica). El capital se convierte en un activo caliente que debe ser gestionado activamente en beneficio del sistema, alineando el interés del acumulador de riqueza con la necesidad de inversión de la sociedad.
Efecto en la matriz:
Dilema clásico de inversión:
- Cooperar (invertir en proyecto colectivo): Riesgo compartido
- Traicionar (acumular dinero): Seguridad garantizada
Con oxidación:
- Cooperar (invertir): Preservas capital + potencial retorno
- Traicionar (acumular): Pierdes -1% mensual = -12% anual
Nueva estrategia dominante: Invertir (cooperar)
D. Transparencia Total (Blockchain)
[editar | editar código]El Dilema del Prisionero se agrava por la asimetría de información: no sabes si el otro cooperará.
La Blockchain y la transparencia total eliminan esta asimetría.
Información perfecta:
- Todas las transacciones son públicas
- Todos los compromisos son verificables
- Todo el historial es inmutable
Efecto en la matriz:
| Con asimetría de información | Con transparencia total |
|---|---|
| No sé si el otro cooperará → Mejor traicionar por seguridad | Sé que el otro cooperará (su CdC alto lo garantiza) → Seguro cooperar |
| Puedo traicionar y ocultar → Incentivo a traicionar | No puedo ocultar traición → Desincentivo a traicionar |
| Resultado: Defección mutua | Resultado: Cooperación mutua |
E. Fondo Solidario de Riesgos (FSR)
[editar | editar código]El FSR elimina el miedo existencial que obliga a "traicionar" (competir destructivamente) por supervivencia.
Piso de seguridad:
- Cobertura universal automática
- No puedes perderlo todo
- Fallo honesto no te destruye
Efecto en la matriz:
Sin FSR: "Debo competir agresivamente o moriré de hambre" → Estrategia de supervivencia = traicionar
Con FSR: "Tengo piso mínimo garantizado, puedo cooperar sin miedo existencial" → Estrategia óptima = cooperar
5. Comparación de Equilibrios
[editar | editar código]Sistema Tradicional (Dilema Activo)
[editar | editar código]Características:
- Juego de suma cero
- Información asimétrica
- Horizonte temporal corto
- Sin reputación vinculante
- Sin mecanismos de coordinación
Equilibrio de Nash: Defección mutua (todos pierden)
Resultado: Competencia destructiva, desconfianza, suboptimalidad
Sistema Demárquico (Dilema Resuelto)
[editar | editar código]Características:
- Juego de suma positiva (AU50)
- Información simétrica (blockchain)
- Horizonte temporal largo (longevidad)
- Reputación vinculante (CdC)
- Mecanismos de coordinación (MI, AsC, ASI-AdC)
Equilibrio de Nash: Cooperación mutua (todos ganan)
Resultado: Colaboración constructiva, confianza, optimalidad de Pareto
6. Casos de Estudio
[editar | editar código]Caso 1: Competencia Empresarial → Colaboración Productiva
[editar | editar código]Capitalismo:
- Dos empresas compiten por cuota de mercado
- Estrategia dominante: Reducir costos (explotación laboral, contaminación)
- Resultado: Carrera hacia el fondo, ambas explotan
Demarquía:
- Dos empresas en el mismo sector
- AU50: Ambas aportan 50% al FC, reciben 50% del valor total creado
- Si una mejora su proceso, ambas se benefician (vía DP)
- CdC: Explotar reduce tu reputación → pierdes acceso a talento
- Estrategia dominante: Optimizar calidad y sostenibilidad
- Resultado: Carrera hacia la excelencia, ambas prosperan
Caso 2: Tragedia de los Comunes → Gestión Sostenible
[editar | editar código]Capitalismo:
- Pescadores comparten un caladero
- Estrategia dominante: Pescar lo máximo posible antes que otros
- Resultado: Sobreexplotación, colapso del recurso
Demarquía:
- Caladero gestionado por FC
- Oxidación: Capital no invertido en sostenibilidad se evapora
- CdC: Sobreexplotar reduce tu acceso a futuros proyectos
- MI: Mercados predicen colapso si no se respetan cuotas
- AsC: Ajusta cuotas basándose en predicciones de MI
- Estrategia dominante: Respetar límites sostenibles
- Resultado: Recurso se mantiene indefinidamente
Caso 3: Innovación Tecnológica
[editar | editar código]Capitalismo:
- Empresas ocultan innovaciones (patentes, secretos comerciales)
- Estrategia dominante: Monopolizar conocimiento
- Resultado: Innovación lenta, duplicación de esfuerzos
Demarquía:
- AU50: 50% del valor de la innovación va al FC
- Si compartes conocimiento, otros lo mejoran → tu parte del FC aumenta
- CdC: Compartir conocimiento aumenta reputación
- Estrategia dominante: Colaboración abierta
- Resultado: Aceleración exponencial de innovación
7. Análisis Matemático
[editar | editar código]Valor Esperado de Estrategias
[editar | editar código]En capitalismo:
- E(Cooperar) = P(otro coopera) × (+3) + P(otro traiciona) × (-5)
- E(Traicionar) = P(otro coopera) × (+5) + P(otro traiciona) × (-1)
Si P(otro coopera) < 0.75, entonces E(Traicionar) > E(Cooperar)
En Demarquía:
- E(Cooperar) = P(otro coopera) × (+10) + P(otro traiciona) × (+5) - Costo_oxidación_si_no_cooperas
- E(Traicionar) = P(otro coopera) × (+3) + P(otro traiciona) × (-5) - Pérdida_CdC
Análisis:
- Pérdida_CdC >> cualquier ganancia a corto plazo
- Costo_oxidación hace que no cooperar sea costoso incluso si no traicionas activamente
- Para cualquier P: E(Cooperar) > E(Traicionar)
Juegos Repetidos e Iterados
[editar | editar código]Teorema (Axelrod, 1984): En juegos repetidos infinitamente, la estrategia "Tit-for-Tat" (cooperar primero, luego imitar al otro) puede estabilizar la cooperación.
Aplicación Demárquica:
- Longevidad extendida = juego "casi infinito" (300+ rondas)
- CdC = memoria perfecta de comportamiento pasado
- Blockchain = registro inmutable de "tit-for-tat"
- Resultado: Cooperación se vuelve equilibrio de Nash robusto
8. Críticas y Limitaciones
[editar | editar código]A. "Asume Racionalidad Perfecta"
[editar | editar código]Crítica: Los humanos no son perfectamente racionales.
Respuesta:
- Los mecanismos están diseñados para ser robustos ante irracionalidad limitada
- ASI-AdC ayuda a humanos a entender consecuencias de sus acciones
- La mayoría solo necesita ser "racionalmente egoísta", no perfectamente racional
B. "Requiere Horizonte Temporal Largo"
[editar | editar código]Crítica: Sin longevidad extendida, CdC puede no ser suficiente incentivo.
Respuesta:
- Incluso con vida normal, CdC afecta oportunidades durante 30-40 años
- Los mecanismos (AU50, Oxidación, FSR) funcionan independientemente de longevidad
- Longevidad simplemente amplifica el efecto
C. "Vulnerable a Coordinación para Traicionar"
[editar | editar código]Crítica: ¿Y si un grupo se coordina para traicionar colectivamente?
Respuesta:
- Transparencia total hace coordinación secreta imposible
- MI detecta desviaciones y alertan a AsC
- CdC se pierde para todo el grupo coordinado
- Costo de coordinación >> beneficio de traición coordinada
9. Conclusión
[editar | editar código]El Dilema del Prisionero no es una ley inmutable de la naturaleza humana. Es una consecuencia de reglas del juego mal diseñadas.
La Demarquía Planetaria demuestra que, mediante el Diseño de Mecanismos inteligente basado en el Principio de Mínima Acción, es posible crear un sistema donde:
- La cooperación es la estrategia dominante
- El equilibrio de Nash coincide con el óptimo de Pareto
- El egoísmo racional conduce al bien común
- La traición es económicamente irracional
El Dilema del Prisionero se resuelve no combatiendo el egoísmo humano, sino canalizándolo inteligentemente mediante incentivos estructurales.
Síntesis final:
La Demarquía no te pide que seas altruista. Te diseña un mundo donde ser egoísta te obliga a hacer el bien.
El Dilema del Prisionero se resuelve cuando traicionar es más costoso que cooperar, y cooperar es más rentable que competir.
Conceptos Relacionados
[editar | editar código]| Concepto | Relación |
|---|---|
| Teoría de Juegos | Dilema del Prisionero es el ejemplo paradigmático |
| Diseño de Mecanismos | Modificación de matriz de pagos para resolver el dilema |
| Egoísmo Ilustrado | Filosofía que canaliza egoísmo hacia cooperación |
| AU50 | Convierte juego en suma positiva |
| CdC Capital de Confianza | Hace traición costosa a largo plazo |
| Oxidación Monetaria | Elimina incentivo a acumular (defección pasiva) |
| Principio de Mínima Acción | Cooperar se vuelve camino de menor resistencia |
| Tragedia de los Comunes | Caso especial de Dilema del Prisionero multijugador |
| Equilibrio de Nash | En Demarquía coincide con óptimo de Pareto |
Véase También
[editar | editar código]- Teoría de Juegos - Marco teórico general
- Diseño de Mecanismos - Herramienta para resolver el dilema
- Egoísmo Ilustrado - Filosofía subyacente
- Asociación Universal al 50% - Mecanismo de suma positiva
- CdC Capital de Confianza - Reputación vinculante
- Tragedia de los Comunes - Dilema en recursos compartidos
- Equilibrio de Nash - Concepto de solución en teoría de juegos
- Homo Debitum - Humano atrapado en el dilema
Referencias
[editar | editar código]- Tucker, A. W. (1950). "A Two-Person Dilemma"
- Axelrod, R. (1984). The Evolution of Cooperation
- Rapoport, A. & Chammah, A. (1965). Prisoner's Dilemma
- Dawes, R. M. (1980). "Social Dilemmas"
- Ostrom, E. (1990). Governing the Commons (soluciones al dilema)
- Binmore, K. (2007). Game Theory: A Very Short Introduction
- Nowak, M. (2006). "Five Rules for the Evolution of Cooperation"