Después de la pantalla plana

Capítulo 14

Las tecnologías del futuro y la cuestión de la responsabilidad del diseño

Todo este libro ha estado dedicado a una pequeña ventana que muestra nuestra propia imagen en la esquina de una pantalla plana. Pero la pantalla plana es, a día de hoy, una mera tecnología intermedia. Cientos de millones de personas ya usan filtros de RA, decenas de millones se ponen visores de RV, y las empresas vuelcan miles de millones en dispositivos de realidad aumentada o mixta destinados a sustituir al portátil, al teléfono y a la cámara de videoconferencia. La pregunta que planteamos al principio de este libro ("¿Qué le ocurre al cerebro de una persona cuando se observa a sí misma mientras se comunica?") no se desvanecerá sin más en los próximos años; se volverá infinitamente más compleja.

La autoimagen en la realidad virtual

En 2025, Jeremy Bailenson (el investigador más citado de este libro) y sus colegas publicaron en Nature Human Behaviour una revisión que abarca veinticinco años de investigación experimental sobre la interacción social en realidad virtual: desde los primeros visores aparatosos con medio segundo de latencia hasta los dispositivos ligeros con seguimiento ocular integrado ^[1]. De la multitud de hallazgos, cinco tienen relevancia directa para el tema de la autoimagen.

Primero. La sensación de presencia (cuán profundamente una persona siente que está "dentro" del entorno virtual) depende menos de la fidelidad gráfica y más de la naturaleza de la tarea. Para el entrenamiento de habilidades o la psicoterapia, una alta inmersión es muy beneficiosa: un cirujano que practica una operación, un piloto que practica un aterrizaje, un paciente con una fobia que se encuentra con una araña o una serpiente. Pero para las reuniones de trabajo rutinarias, como señala la revisión, la inmersión total es excesiva y agotadora. El cerebro gasta tanto recurso en procesar el entorno tridimensional que quedan menos recursos para el contenido de la discusión. Esto confirma una idea a la que hemos vuelto a lo largo de todo este libro: no toda comunicación requiere video. Y aún menos requiere realidad virtual.

Segundo. La apariencia física de un avatar —el cuerpo virtual que controla el usuario— altera la conducta del usuario. Este es el efecto Proteo, descrito por primera vez por Nick Yee y Bailenson en 2007 ^[2]: una persona a la que se le da un avatar atractivo se comporta con más seguridad; una persona a la que se le da un avatar alto se vuelve más asertiva en las negociaciones. La influencia del avatar sobre la conducta del usuario ocurre de forma inconsciente. La persona no toma la decisión deliberada de "Mi avatar es bello, por lo tanto seré más audaz". Simplemente, y de forma automática, se vuelve más audaz. La autoimagen observada desde fuera reprograma el estado interno: este es exactamente el mismo mecanismo que nos hace sentir peor al mirar un reflejo distorsionado por la cámara.

Tercero. Los dispositivos de RV recopilan un volumen de datos biométricos sin precedentes. Movimientos de la cabeza, seguimiento ocular, gestos de las manos, microexpresiones faciales: todo ello conforma un perfil cinemático único que puede identificar a un usuario con precisión milimétrica y, con el tiempo, evaluar su estado emocional sin su consentimiento. La autoimagen en Zoom es, al menos, visible: sabes que te estás mirando y puedes decidir cómo te sientes al respecto. La recolección biométrica en RV es invisible y queda oculta al usuario. Es la observación del observador, del todo sin su conocimiento.

Cuarto. El cerebro subestima de forma sistemática las distancias en los entornos virtuales. El avatar de un interlocutor, situado lógicamente a una distancia de "dos metros" en el sistema de coordenadas de la RV, se percibe como si estuviera entre un veinte y un treinta por ciento más cerca. Esto viola la proxémica —la regulación intuitiva de la distancia interpersonal descrita por Edward Hall— y reproduce exactamente el efecto que Bailenson describió para Zoom: el rostro del interlocutor invade tu zona íntima. La diferencia es que en RV esta sensación se experimenta con una intensidad bastante mayor que en una pantalla plana.

Quinto. La conducta social en RV se transfiere de forma robusta al mundo real. Una experiencia vivida en un entorno virtual (por ejemplo, observar las consecuencias de la deforestación desde una perspectiva en primera persona) altera la conducta en el mundo real (en este ejemplo, los hábitos ecológicos) durante hasta varias semanas. La experiencia virtual, incluida la de observarse a uno mismo, no queda aislada dentro de la realidad virtual; se filtra al mundo fuera de línea.

Efecto Proteo 2.0: la autoimagen sin el yo

El efecto Proteo crea una situación curiosa. En una videollamada clásica, la autoimagen muestra tu rostro real, con sus arrugas, asimetrías y ojos cansados. En un entorno virtual, el análogo de la autoimagen muestra un avatar. Sigue siendo "tú" —controlas sus movimientos, imita tus expresiones faciales—, pero ya no eres estrictamente tú.

La investigación de Yee y Bailenson demostró que el vínculo entre la apariencia de un avatar y la conducta de su dueño se forma con rapidez y opera por debajo del umbral de la conciencia ^[2]. Como se mencionó, los participantes que controlaban avatares más atractivos se situaban más cerca de desconocidos virtuales y revelaban más información personal. Los participantes con avatares altos eran más agresivos en las tareas de negociación. Es más, la conducta persistía incluso después de salir del entorno virtual: una persona que había sido "alta" en RV seguía actuando con más seguridad en interacciones cara a cara posteriores.

Tanto los gigantes tecnológicos como las pequeñas startups ya están probando avatares de IA para reuniones virtuales: gemelos digitales que se ven "como tú, pero mejor". Piel tersa, rasgos simétricos, atuendo profesional, microexpresiones suavizadas. Si el efecto Proteo se cumple —y se cumple—, este avatar mejorado no solo sustituirá tu imagen ante los demás; te cambiará a ti. La persona empezará a comportarse en consonancia con cómo se ve su gemelo digital. Esto no requiere esfuerzo; ocurre de forma inconsciente y automática.

Desde la perspectiva de todo lo que sabemos sobre la FAI hasta ahora, aquí surge una paradoja. Por un lado, un avatar podría aliviar ciertas ansiedades: no hay que preocuparse por arrugas, manchas o distorsión de barril. El Controlador, por ejemplo, no tendrá ya nada que controlar: el algoritmo lo hace por él. Por otro lado, se abre una nueva brecha: el abismo entre cómo se ve el avatar y cómo se siente la persona dentro de su cuerpo físico real. El Objetivado recibirá un nuevo estándar imposible que su rostro real nunca podrá alcanzar. El que se Esconde descubrirá que esconderse tras un avatar es aún más fácil que esconderse tras una ventana de autoimagen. Una autoimagen sin un "yo" real corre el riesgo de convertirse no en la solución del problema del espejo digital, sino en su siguiente iteración, más grave.

Personas reales como fantasmas

En 2024, Michael Santoso y Bailenson investigaron el "video passthrough": una tecnología en la que el usuario de un visor de realidad mixta ve el mundo físico circundante a través de las cámaras integradas del dispositivo ^[3]. Así funcionan el Apple Vision Pro y dispositivos similares: te pones el visor y aparentemente ves exactamente la misma habitación —el escritorio, las sillas, la ventana, las personas—. Pero no la ves directamente; la ves de forma mediada, a través de pantallas internas que crean la ilusión de transparencia.

Resultó que el passthrough inducía lo que los autores denominaron "cibermareo" (cybersickness): náuseas y desorientación ligadas a un desajuste entre el sistema vestibular y la señal visual. La tecnología distorsiona la percepción de la distancia: los objetos parecen estar más cerca o más lejos de lo que en realidad están. Como resultado, se altera el esquema corporal: el sentido interno de los límites del propio "yo" físico, que por lo general permanece por debajo del umbral de la conciencia pero que dicta todas nuestras interacciones motoras con el mundo.

Lo particularmente fascinante es que ¡las personas reales físicamente presentes en la misma habitación se percibían como "menos presentes"! Una persona que lleva un visor de realidad mixta mira a un colega sentado a un metro de distancia, y ese colega parece un poco menos real. Al fin y al cabo, ha sido transformado en una proyección digital sobre la pantalla interna del visor. El ordenador espacial, que prometía borrar las fronteras, en cambio reproduce el mayor defecto de la videoconferencia: el distanciamiento y la transformación de un ser humano vivo en un objeto de pantalla. Los autores denominaron a este efecto "ausencia social".

Esto es crucial para nuestro tema por varias razones. Primero, los dispositivos de realidad mixta se comercializan como ordenadores espaciales que, a diferencia de los portátiles, no aíslan al usuario de su entorno. Sin embargo, esta es justo la promesa que no cumplen. Los materiales de marketing muestran a una persona con un visor interactuando con libertad con su familia. La realidad, por ahora, es distinta: la persona con el visor está atrapada en un capullo translúcido, viendo a su familia como proyecciones algo descarnadas.

Segundo, si la tecnología de realidad mixta empieza a usurparle al portátil el papel de pantalla de trabajo principal —y las inversiones de las mayores empresas del mundo apuntan exactamente en esa dirección—, entonces la "ausencia social" pasará de ser una observación de laboratorio a una realidad cotidiana. Un colega se sienta a tu lado, pero se percibe como un holograma. Trasladar la señal de video de un monitor externo al interior de una pantalla que se lleva en la cara genera nuevas formas de la mismísima disociación comentada en el Capítulo 11. Si en una videollamada estándar el problema lo crea tu propia imagen, en la realidad mixta se difumina la presencia de todos: la tuya y la de ellos. ¿Con qué rapidez nos adaptaremos a esto, y qué efectos secundarios encontraremos cuando se masifique?

Filtros y retoque con IA

Los filtros de RA empezaron como entretenimiento: orejas de perro, narices de conejo, estrellas centelleantes. Pero la evolución de los filtros pronto superó la novedad. Hoy, incluso las cámaras por defecto de la mayoría de los teléfonos suavizan sutilmente la piel de fábrica: lo más probable es que el usuario nunca activara esta función y a menudo ni siquiera sepa que existe. Las plataformas de videoconferencia ofrecen funciones de "Retocar mi aspecto": una casilla en los ajustes de Zoom, y los poros se esfuman, el tono de la piel se uniforma y las ojeras se atenúan. Las herramientas de IA de nueva generación permiten al usuario alterar en tiempo real la forma del rostro, el tamaño de la nariz y el color de los ojos, todo ello enmarcado como mejoras "cosméticas", lo que en la práctica funciona como deepfakes sin la intención de hacerse pasar por otra persona.

Como mencionamos antes, en 2025 Sahil Mehta y Tarunpreet Narang propusieron el término paraguas dismorfia digitalizada, que une tres fenómenos afines ^[4]. La dismorfia de Zoom: la percepción distorsionada del propio aspecto por la óptica de la cámara web, principalmente la distorsión de barril, que ensancha la nariz un 30 %. La dismorfia de Snapchat: el afán de alinear el rostro real con una imagen con filtro, lo que lleva a la gente a los cirujanos plásticos pidiendo "hacer que me parezca a este filtro". Y, por supuesto, la "cara de Instagram": un ideal estético unificado de contornos nítidamente definidos, pómulos altos y labios carnosos, hacia el que convergen rostros de orígenes étnicos muy distintos tras el procesamiento digital. Las tres "tendencias" dismórficas nacen de un único mecanismo: la imagen tecnológica suplanta a la imagen corporal interna y se convierte en el punto de referencia de la autopercepción.

Mehta y Narang destacaron un fenómeno que denominaron deriva estética profesional ^[4]. Los dermatólogos y cirujanos plásticos, que interactúan a diario con imágenes filtradas de sus pacientes en las redes sociales, pierden poco a poco su línea de base objetiva de lo "normal". Un rostro sin editar ni filtrar empieza a parecerles insuficientemente terso o simétrico. El estándar de normalidad se desplaza, no solo para los pacientes, sino para los propios profesionales que se suponía que debían servir de árbitros últimos de la evaluación objetiva.

He aquí por qué esto importa para nuestro tema. En el Capítulo 6, al hablar del Objetivado, describimos dos capas de desconexión: una entre la imagen corporal interna y lo que muestra un espejo corriente, y una segunda entre el espejo y lo que muestra una cámara (lente gran angular, distorsión, luz plana). El filtro añade una tercera capa: la desconexión entre la imagen "sin filtrar" y la versión retocada. La persona se acostumbra a su gemelo digital mejorado, y un reflejo corriente —en el espejo del baño, por ejemplo— empieza a causar malestar. Es casi de cuento de hadas: el espejo que se niega a halagar se vuelve desagradable de mirar. El círculo vicioso del automonitoreo descrito en el Capítulo 3 da un nuevo giro: ahora la persona se compara no solo con un ideal imaginado, sino con una imagen concreta y retocada de sí misma que vio ayer en una pantalla.

El audio como la alternativa olvidada

En este contexto, conviene recordar un formato que no solo dista de estar obsoleto, sino que quizá esté injustamente marginado. Hemos mencionado dos veces el estudio de la Universidad Carnegie Mellon. Descubrieron que los grupos que trabajaban en formato solo de audio —sin video— mostraban mayor inteligencia colectiva que los grupos con la cámara encendida. La inteligencia colectiva no es la suma de los CI individuales de los participantes; es la capacidad del grupo de resolver problemas diversos mejor de lo que podría cualquiera de sus miembros por separado. Y esta métrica era más alta con el video apagado.

Para el lector de este libro, el mecanismo ya está claro. Sin cámara, los participantes no dilapidan recursos cognitivos en gestionar su propio aspecto. Apagar el video restauraba la sincronía prosódica: los participantes empezaban a leer con más precisión la entonación, el ritmo y las pausas de las voces de los demás. La atención liberada del tercer canal se redirigía a los otros dos: el contenido y la voz del hablante.

Esto no es en absoluto un argumento contra la videoconferencia en su conjunto. Hay situaciones en las que ver a la otra persona es crítico: negociaciones complejas, primeras presentaciones, sesiones de terapia, conversaciones cargadas de emoción. Pero es un recordatorio necesario de que el video no es el único canal, ni siempre el más apropiado. Para muchas tareas de trabajo —lluvia de ideas, sincronizaciones rutinarias, actualizaciones de estado—, una llamada telefónica o una audioconferencia podría ser no solo suficiente, sino muchísimo más eficaz. El tercer canal, todo el tema de este libro, se desvanece por completo en el segundo en que se apaga la cámara.

La cuestión de la responsabilidad

Las tecnologías se vuelven más complejas. Filtros, avatares, visores: cada nueva capa genera nuevas preguntas sobre cómo la representación digital afecta a la autopercepción del usuario. Pero la pregunta original —con la que empezó este libro— sigue sin resolverse: ¿quién es responsable de que la autoimagen venga activada por defecto?

En el Capítulo 12 esbozamos tres niveles de responsabilidad: el usuario, la organización y la plataforma. Para las tecnologías de nueva generación, este marco se mantiene, y se vuelve aún más crítico, porque en la RV y la realidad mixta los "ajustes por defecto" penetran en capas todavía más profundas de la percepción humana.

El usuario puede, en teoría, ocultar su autoimagen, apagar su filtro o elegir el audio en lugar del video. Pero, para hacerlo, debe saber que el problema existe, comprender su mecanismo y poseer la destreza y la motivación para actuar. El libro que estás leyendo sirve exactamente a este propósito, pero no todo el mundo leerá este libro.

La organización puede establecer normas culturales: cámaras opcionales, formatos de audio para las reuniones rutinarias, un tope diario de horas de video. Pero los cambios organizacionales son lentos, y las normas culturales son frágiles. Basta exactamente con un directivo convencido de que "las cámaras deben estar encendidas, si no, ¿cómo sé que la gente trabaja?" para que toda la política se derrumbe.

La plataforma puede cambiar sus ajustes por defecto, y esta podría ser la palanca más poderosa de todas. Una decisión tomada por un equipo de unos pocos cientos de ingenieros, especialistas en marketing y gestores de producto impacta al instante a cientos de millones de usuarios. Activar la autoimagen por defecto fue una decisión de diseño, de interfaz. Desactivarla también lo es. Añadir un temporizador que oculte automáticamente la autoimagen a los treinta segundos de una llamada requiere unas pocas líneas de código. Incorporar un aviso suave en un visor de RV —"Llevas veinte minutos observando tu propio avatar, considera cambiar de vista"— es del todo factible. Desactivar la alteración por defecto de las proporciones faciales por parte de los filtros de belleza. Atenuar los efectos de la distorsión óptica mediante corrección por software.

Esto no es un problema tecnológico; es uno ético. La arquitectura de la elección dentro de estas plataformas se construye actualmente sin la menor consideración por las consecuencias psicológicas. Y, hasta que los diseñadores de interfaces asuman la responsabilidad de la ergonomía cognitiva, esa carga recae por entero en el usuario. Parece lógico que, si la sociedad aprendió a exigir información sobre los efectos secundarios de los aditivos alimentarios, debería desarrollar una exigencia similar de conciencia sobre el coste cognitivo de los productos digitales.

El espejo que cura

La historia del espejo digital quedaría incompleta sin reconocer su potencial terapéutico. Volvamos a una historia mencionada antes en el libro. A mediados de los años noventa, el neurocientífico V. S. Ramachandran se topó con una paradoja: pacientes con brazos amputados se quejaban de un dolor atroz en una extremidad que ya no existía. La mano fantasma se sentía apretada en un puño firme, con las uñas clavándose en la palma, y abrirla era imposible porque no había nada que abrir. Ramachandran colocó un espejo frente al paciente de modo que el reflejo de su brazo sano creaba la ilusión de dos brazos sanos. El paciente abría su mano sana, y el cerebro "veía" abrirse también la mano fantasma. El dolor remitía. La terapia de la caja de espejos de Ramachandran funciona, y todavía hoy se utiliza: para el dolor de miembro fantasma, la rehabilitación tras un ictus y el síndrome de dolor regional complejo.

Este ejemplo es vital para nuestro tema porque demuestra una vez más: un espejo no es ni "bueno" ni "malo"; es neutro. Su efecto lo dicta por completo su contexto. Ramachandran usó el espejo de forma consciente, intencionada, en condiciones controladas y con una comprensión precisa del mecanismo neurobiológico. Sabía exactamente qué señal recibiría el cerebro, y era justo la señal que se necesitaba.

La autoimagen en una videollamada también es un espejo. Pero nos afecta de forma automática, sin conciencia, sin propósito, sin control y sin que comprendamos su mecanismo. Es un espejo digital concebido como una función técnica y dejado en marcha durante miles de millones de horas-persona seguidas. Mientras siga siendo un ajuste de interfaz por defecto en lugar de una elección consciente del usuario, el espejo digital seguirá trabajando en nuestra contra. Sí, podemos abogar por soluciones a nivel organizacional y esperar iniciativas de las plataformas. Pero tu mejor jugada es ocultar la autoimagen en tu próxima videollamada.

Referencias

[1] Bailenson, J. N., et al. (2025). Twenty-five years of social interaction in virtual reality. Nature Human Behaviour.

[2] Yee, N., & Bailenson, J. N. (2007). The Proteus effect: The effect of transformed self-representation on behavior. Human Communication Research, 33(3), 271–290.

[3] Santoso, M., & Bailenson, J. N. (2024). Video passthrough, cybersickness, and social presence in mixed reality. Estudio realizado en el Stanford Virtual Human Interaction Lab.

[4] Mehta, S., & Narang, T. (2025). Digitized Dysmorphia. Journal of the American Academy of Dermatology (JAAD).