Nuevas telecomunicaciones audiovisuales: de la videollamada al metaverso
Fecha: 13-02-2023
La banda ancha móvil mejorada -en términos de velocidad, que quiere decir de fidelidad en el audio y de resolución en en vídeo- que trae 5G como categoría de servicio han permitido el auge de las telecomunicaciones audiovisuales, toda vez que el uso predominante por el gran público se asocia al vídeo en movilidad y a que los fabricantes de dispositivos inalámbricos buscan la manera de integrar en uno las experiencias visual y auditiva, a través de los visores, que auguran la reproducción y la interacción con las llamadas realidades alternativas (esto es, la aumentada, orientada a la visualización de imágenes remotas para su más fácil comprehensión y para actuar sobre la misma y la virtual, creando apariencias según diseños ajenos a la realidad conocida).
El vídeo, sea de estudio y propiedad intelectual -motor de los relatos de las «fábricas de sueños» como Disney, Netflix o Amazon o de los proveedores de juegos en línea como Activision Blizzard, Electronic Arts o Roblox- sea público, como YouTube, sea personal, como TikTok o sea para uso profesional, es bajo el modelo de «streaming» el principal demandante de ancho de banda en las redes de comunicaciones asociadas a internet. El operador móvil virtual británico ASDA calcula aproximadamente que una hora de Netflix en alta resolución consume 36 GB; de YouTube e 4K, 2,7 GB, frente a los apenas 60 MB de una hora de navegación o los 156 MB por hora de las redes sociales convencionales o los entre 180 MB de FaceTime y los 270 MB de Zoom para videollamadas.
La rápida migración del streaming a los dispositivos móviles y la explosión de la producción de vídeos personales de la mano de TikTok están obligando a los operadores móviles a hacer ofertas de datos cada vez más generosas, con una amplia elección de tarifas ilimitadas o, tal vez más sugestivamente, «infinitas», hasta el umbral del uso razonable que rige para el «roaming», creando un enorme desafío en la repercusión de los costes e inversiones requeridos para competir con éxito por la atención de los usuarios, cada vez más selectivos en los contenidos y previsiblemente más exigentes con la calidad de su experiencia. Superados los umbrales perceptibles de calidad de imagen y sonido, se crearán las condiciones para las comunicaciones audiovisuales «inmersivas», esas en las que en palabras del jurista José María Lassalle en un coloquio sobre el metaverso en la Fundación Juan March el pasado 23 de enero, disponible en el canal de dicha institución, la persona -o quizás más bien la personalidad- se sitúa «al otro lado de la pantalla», en un mundo paralelo, que aporta un conocimiento aumentado de la realidad que trae consigo ciertos beneficios susceptibles de valoración (en términos de esfuerzo, aptitud y rendimiento) o incluso una realidad virtual, inspirada en la memoria o la imaginación de quien la diseña y en la que participan quienes se introducen en ella.
Los fondos de acciones de EEUU asisten a una retirada masiva de capital en pleno rally Una demanda de ancho de banda consistentemente por encima de 1 Gbps y de un retardo mínimo, cercano al milisegundo, que se corresponde con el standard «pico» de 5G requiere una arquitectura tecnológica optimizada, en un medio controlado y sobretodo sendos habilitadores en forma de aplicaciones -para cuyo desarrollo en España Utopia Voyagers, con más de 230 proyectos asociados a 90 marcas, entre otras Coca-Cola, que lanzó recientemente una promoción asociada a juegos con personajes de una de las factorías de contenido de referencia titulada «Multiverso», así como las de los tres operadores de red -alguno de los cuales ya ha designado un responsable de metaverso- y que ofrece una formación con un postgrado expedido por la Universidad Complutense de Madrid.
Visores de realidad virtual
Además, para que las referidas telecomunicaciones inmersivas se hagan realidad se requiere un catálogo nuevo y versátil de dispositivos de usuario, en forma de gafas, diademas o visores, que previsiblemente se disputarán la preferencia del gran público como ocurre en el mercado de los teléfonos móviles a los que pueden llegar a sustituir, en razón del sistema operativo asociado, tal vez legatarios del duopolio actual en la telefonía móvil (Android, iOS).
Entretanto se consolidan las telecomunicaciones en tres dimensiones, como las que augura el metaverso, la videollamada, particularmente en multiconferencia y gracias a las ya exitosas aplicaciones vinculadas a las nubes públicas (Microsoft Teams, Google Meet, Zoom, ésta última apoyada en AWS), suponen la extensión al gran público del servicio de «telepresencia» del que fue pionero hace más de una década el fabricante de equipamientos Cisco y que supuso -en condiciones determinadas que exigían replicar el entorno de los participantes y un ancho de banda de apenas 4 Mbps, pero expuesto a la «pérdida de paquetes» que pondrían en riesgo la resolución y la calidad de la experiencia- una primera aproximación a lo que vienen a ser las telecomunicaciones inmersivas, centradas actualmente en lo audiovisual.
En efecto, el vídeo ha pasado de ser uno de los componentes de las «comunicaciones unificadas» del mercado de empresas, del que fuera pionera en 1993 IBM con su «suite» para uso propio ThinkRite, a una herramienta de comunicación masiva, en gran medida gracias a su incorporación a
las herramientas de mensajería instantánea y más concretamente a WhatsApp. Según Logitech, en 2022 cerca del 76% de los usuarios estadounidenses lo utilizaban de alguna manera en su trabajo (el 38 por ciento de quienes tienen entre 18 y 29 años utilizan el móvil para establecer videollamadas en su lugar de trabajo) y según el proveedor de la aplicación de vídeo del mismo nombre Lifesize, más de la mitad de ellos manifestaban que tal utilización les reportaba ahorros de tiempo, reducción de costes o diversas combinaciones de las dos cosas.
Según Ring Central, otro proveedor de herramientas de vídeo, el 93% de la comunicación interpersonal es no verbal, lo que avalaría la percepción del 87% de los participantes en una encuesta conjunta de Spearline y Cisco Webex de sentirse más próximas a sus interlocutores a través del vídeo. Tal apariencia de cercanía y accesibilidad está propiciando conductas más informales pero igualmente eficientes, pues no se trata solo del tiempo propio y ajeno, recurso difícilmente poco valorado si no del uso de la tecnología, que tiene un cierto coste implícito. Estos aspectos antropológicos de las telecomunicaciones audiovisuales condicionan los desarrollos técnicos en términos de funcionalidad y ergonomía, en el avance hacia una experiencia sensorial completa, como la que alrededor de las tecnologías hápticas y la extensión al tacto describe el artículo titulado The touchy-feely world of the metaverse and future gadgets en The Economist del 2 de febrero pasado.
La banda ancha móvil mejorada -en términos de velocidad, que quiere decir de fidelidad en el audio y de resolución en en vídeo- que trae 5G como categoría de servicio han permitido el auge de las telecomunicaciones audiovisuales, toda vez que el uso predominante por el gran público se asocia al vídeo en movilidad y a que los fabricantes de dispositivos inalámbricos buscan la manera de integrar en uno las experiencias visual y auditiva, a través de los visores, que auguran la reproducción y la interacción con las llamadas realidades alternativas (esto es, la aumentada, orientada a la visualización de imágenes remotas para su más fácil comprehensión y para actuar sobre la misma y la virtual, creando apariencias según diseños ajenos a la realidad conocida).
El vídeo, sea de estudio y propiedad intelectual -motor de los relatos de las «fábricas de sueños» como Disney, Netflix o Amazon o de los proveedores de juegos en línea como Activision Blizzard, Electronic Arts o Roblox- sea público, como YouTube, sea personal, como TikTok o sea para uso profesional, es bajo el modelo de «streaming» el principal demandante de ancho de banda en las redes de comunicaciones asociadas a internet. El operador móvil virtual británico ASDA calcula aproximadamente que una hora de Netflix en alta resolución consume 36 GB; de YouTube e 4K, 2,7 GB, frente a los apenas 60 MB de una hora de navegación o los 156 MB por hora de las redes sociales convencionales o los entre 180 MB de FaceTime y los 270 MB de Zoom para videollamadas.
La rápida migración del streaming a los dispositivos móviles y la explosión de la producción de vídeos personales de la mano de TikTok están obligando a los operadores móviles a hacer ofertas de datos cada vez más generosas, con una amplia elección de tarifas ilimitadas o, tal vez más sugestivamente, «infinitas», hasta el umbral del uso razonable que rige para el «roaming», creando un enorme desafío en la repercusión de los costes e inversiones requeridos para competir con éxito por la atención de los usuarios, cada vez más selectivos en los contenidos y previsiblemente más exigentes con la calidad de su experiencia. Superados los umbrales perceptibles de calidad de imagen y sonido, se crearán las condiciones para las comunicaciones audiovisuales «inmersivas», esas en las que en palabras del jurista José María Lassalle en un coloquio sobre el metaverso en la Fundación Juan March el pasado 23 de enero, disponible en el canal de dicha institución, la persona -o quizás más bien la personalidad- se sitúa «al otro lado de la pantalla», en un mundo paralelo, que aporta un conocimiento aumentado de la realidad que trae consigo ciertos beneficios susceptibles de valoración (en términos de esfuerzo, aptitud y rendimiento) o incluso una realidad virtual, inspirada en la memoria o la imaginación de quien la diseña y en la que participan quienes se introducen en ella.
Los fondos de acciones de EEUU asisten a una retirada masiva de capital en pleno rally Una demanda de ancho de banda consistentemente por encima de 1 Gbps y de un retardo mínimo, cercano al milisegundo, que se corresponde con el standard «pico» de 5G requiere una arquitectura tecnológica optimizada, en un medio controlado y sobretodo sendos habilitadores en forma de aplicaciones -para cuyo desarrollo en España Utopia Voyagers, con más de 230 proyectos asociados a 90 marcas, entre otras Coca-Cola, que lanzó recientemente una promoción asociada a juegos con personajes de una de las factorías de contenido de referencia titulada «Multiverso», así como las de los tres operadores de red -alguno de los cuales ya ha designado un responsable de metaverso- y que ofrece una formación con un postgrado expedido por la Universidad Complutense de Madrid.
Visores de realidad virtual
Además, para que las referidas telecomunicaciones inmersivas se hagan realidad se requiere un catálogo nuevo y versátil de dispositivos de usuario, en forma de gafas, diademas o visores, que previsiblemente se disputarán la preferencia del gran público como ocurre en el mercado de los teléfonos móviles a los que pueden llegar a sustituir, en razón del sistema operativo asociado, tal vez legatarios del duopolio actual en la telefonía móvil (Android, iOS).
Entretanto se consolidan las telecomunicaciones en tres dimensiones, como las que augura el metaverso, la videollamada, particularmente en multiconferencia y gracias a las ya exitosas aplicaciones vinculadas a las nubes públicas (Microsoft Teams, Google Meet, Zoom, ésta última apoyada en AWS), suponen la extensión al gran público del servicio de «telepresencia» del que fue pionero hace más de una década el fabricante de equipamientos Cisco y que supuso -en condiciones determinadas que exigían replicar el entorno de los participantes y un ancho de banda de apenas 4 Mbps, pero expuesto a la «pérdida de paquetes» que pondrían en riesgo la resolución y la calidad de la experiencia- una primera aproximación a lo que vienen a ser las telecomunicaciones inmersivas, centradas actualmente en lo audiovisual.
En efecto, el vídeo ha pasado de ser uno de los componentes de las «comunicaciones unificadas» del mercado de empresas, del que fuera pionera en 1993 IBM con su «suite» para uso propio ThinkRite, a una herramienta de comunicación masiva, en gran medida gracias a su incorporación a
las herramientas de mensajería instantánea y más concretamente a WhatsApp. Según Logitech, en 2022 cerca del 76% de los usuarios estadounidenses lo utilizaban de alguna manera en su trabajo (el 38 por ciento de quienes tienen entre 18 y 29 años utilizan el móvil para establecer videollamadas en su lugar de trabajo) y según el proveedor de la aplicación de vídeo del mismo nombre Lifesize, más de la mitad de ellos manifestaban que tal utilización les reportaba ahorros de tiempo, reducción de costes o diversas combinaciones de las dos cosas.
Según Ring Central, otro proveedor de herramientas de vídeo, el 93% de la comunicación interpersonal es no verbal, lo que avalaría la percepción del 87% de los participantes en una encuesta conjunta de Spearline y Cisco Webex de sentirse más próximas a sus interlocutores a través del vídeo. Tal apariencia de cercanía y accesibilidad está propiciando conductas más informales pero igualmente eficientes, pues no se trata solo del tiempo propio y ajeno, recurso difícilmente poco valorado si no del uso de la tecnología, que tiene un cierto coste implícito. Estos aspectos antropológicos de las telecomunicaciones audiovisuales condicionan los desarrollos técnicos en términos de funcionalidad y ergonomía, en el avance hacia una experiencia sensorial completa, como la que alrededor de las tecnologías hápticas y la extensión al tacto describe el artículo titulado The touchy-feely world of the metaverse and future gadgets en The Economist del 2 de febrero pasado.
Como en otros ámbitos de las tecnologías de la información y las comunicaciones, el desarrollo de modelos de suscripción basados en recursos flexibles en las «nubes» públicas ha contribuido a la universalización del vídeo, sustituyendo la antigua dependencia de un operador por la de un sistema operativo de colaboración (principalmente Google con Meet y Microsoft con Teams, entretanto Apple ha conferido a FaceTime la condición de complemento de voz y Amazon a Chime lo ha incluido entre las herramientas a disposición de los titulares de cuentas en su plataforma de comercio electrónico). Esta competencia entre los titanes de internet y la irrupción de proveedores especializados como Zoom, Lifesize o Bluejeans, que han aportado ciertas innovaciones como la estandarización de pantallas compartidas ambientadas («webinar session branding»), el análisis de las conversaciones de los usuarios con propósito comercial («Zoom IQ for sales», basada en el uso de inteligencia artificial para reconocer disposiciones o anticipar reacciones) o más recientemente la edición de vídeo en directo que enriquecen la experiencia de uso, previsiblemente también pronto para el gran público y pueden suponer la transición hacia esas esperadas comunicaciones en tres dimensiones que Meta está empeñada en popularizar, alrededor de sus sorprendentes comunidades virtuales en «Horizon Worlds».
Un repaso rápido a algunos de los principales casos de uso que han servido de referencia en los pilotos de la tecnología 5G, que supone la vanguardia en las comunicaciones inalámbricas en disputa con WiFi-6, confirma al vídeo como el componente básico para su aplicación efectiva. Así, la asistencia remota a operadores, que parece tener un potencial enorme en lo que concierne a la ejecución de acciones con equipamientos de precisión o necesitados de un adiestramiento complejo, sea en quirófanos, en recintos industriales o logísticos, se fundamenta en el uso de la realidad aumentada como un soporte visual para la toma de decisiones o la ejecución de instrucciones basadas en el intercambio de información entre el usuario y su soporte remoto.
Adicionalmente, la docencia y la investigación se benefician de las representaciones visuales multidimensionales, particularmente útiles en tareas de diseño, como demuestran los trabajos del profesor de la Escuela de Arquitectura de la Universidad de Navarra, Javier Antón. En el ámbito de
la seguridad pública, concretamente del reconocimiento facial y de la videovigilancia, la notable mejora de la resolución derivada del mayor ancho de banda de 5G anticipa una capacidad de reacción ante alertas derivadas del tratamiento inmediato de la información obtenida por el agente o en el punto de control móvil en el caso por ejemplo del transporte público colectivo. Naturalmente, en lo que concierne al entretenimiento masivo en movilidad y particularmente el asociado a juegos en línea, el menor retardo ofrecido por 5G hace posible una experiencia de uso que apoyada en la esperada mayor cercanía de los centros de procesamiento de datos (en una situación parecida al alojamiento de los servidores de los proveedores de vídeo como Amazon, HBO o Netflix en las centrales de cabecera de las redes de fibra a los hogares de los operadores) que se aproximará a la que permiten las consolas en el ámbito doméstico, con un dispositivo de usuario que genera una desconcertante presencia en un mundo virtual de tres dimensiones, susceptible de incorporar un sistema de reconocimiento de emociones, cuya regulación está prevista en el proyecto de ley europea de inteligencia artificial y al que ya en 2012 dedicó su proyecto de fin de carrera en la Universidad de Zaragoza Antonio Loscertales Albiol, describiendo el reconocimiento facial automático de emociones basado en vídeos y que en la actualidad alcanza al análisis de la actividad neuronal en entornos de experimentación y más recientemente explorado por investigadores del Instituto de Ciencia y Tecnología de Japón dirigidos por Kazunori Kotani, asociando imágenes de expresiones faciales con la generación de emociones complejas.
Justamente la evaluación de las respuestas y reacciones instantáneas del agente en base a su reconocimiento de la realidad provista por las nuevas telecomunicaciones audiovisuales suscita cuestiones relativas a la protección de derechos fundamentales (señaladamente a la intimidad y en última instancia y en sentido amplio a la libertad) cuya eventual regulación y tutela es objeto de discrepancias entre los estudiosos de un amplio espectro de disciplinas y los líderes de los Estados e instituciones de la Unión Europea, en su particular empeño por anticipar abusos y desviaciones del propósito original de facilitar el acceso a tecnologías que contribuyan al bienestar colectivo. En esta misma línea se movería la iniciativa de la UIT (entidad consultiva de Naciones Unidas para el establecimiento de referencias técnicas básicas en las telecomunicaciones) de crear un grupo de trabajo que elabore un guión para la fijación de estándares para el metaverso, que se reunirá por vez primera bajo los auspicios del gobierno árabe en Riad el próximo 8 de marzo, con cuatro ejes de atención (interoperabilidad, calidad de experiencia de uso, seguridad y protección de datos personales) que conciernen en gran medida igualmente a las telecomunicaciones audiovisuales, si bien el uso del protocolo de Internet y la profusión de plataformas de descargas libres y las redes sociales de última generación han obviado hasta ahora cualquier potencial restricción a la difusión y al aprovechamiento de informaciones de uso mediando previo consentimiento.
En la medida en que el aseguramiento de posibles obligaciones derivadas de las conclusiones de los cuatro ejes de atención concierne a diferentes agentes (operadores, creadores de contenidos, gestores de datos en servidores propios o de terceros, supervisores de ciberseguridad y agencias públicas de protección de datos) y las sensibilidades ante estas cuestiones varían igualmente en función del alcance que se dé a los derechos fundamentales de libertad de expresión, a la intimidad y a la libertad de mercado por parte de los 193 Estados miembros de la UIT, es previsible una amplia disparidad tanto en las aplicaciones disponibles como en la inversión en régimen de competencia en las infraestructuras necesarias para proveer los usos esperados.
Como en otros ámbitos de las tecnologías de la información y las comunicaciones, el desarrollo de modelos de suscripción basados en recursos flexibles en las «nubes» públicas ha contribuido a la universalización del vídeo, sustituyendo la antigua dependencia de un operador por la de un sistema operativo de colaboración (principalmente Google con Meet y Microsoft con Teams, entretanto Apple ha conferido a FaceTime la condición de complemento de voz y Amazon a Chime lo ha incluido entre las herramientas a disposición de los titulares de cuentas en su plataforma de comercio electrónico). Esta competencia entre los titanes de internet y la irrupción de proveedores especializados como Zoom, Lifesize o Bluejeans, que han aportado ciertas innovaciones como la estandarización de pantallas compartidas ambientadas («webinar session branding»), el análisis de las conversaciones de los usuarios con propósito comercial («Zoom IQ for sales», basada en el uso de inteligencia artificial para reconocer disposiciones o anticipar reacciones) o más recientemente la edición de vídeo en directo que enriquecen la experiencia de uso, previsiblemente también pronto para el gran público y pueden suponer la transición hacia esas esperadas comunicaciones en tres dimensiones que Meta está empeñada en popularizar, alrededor de sus sorprendentes comunidades virtuales en «Horizon Worlds».
Un repaso rápido a algunos de los principales casos de uso que han servido de referencia en los pilotos de la tecnología 5G, que supone la vanguardia en las comunicaciones inalámbricas en disputa con WiFi-6, confirma al vídeo como el componente básico para su aplicación efectiva. Así, la asistencia remota a operadores, que parece tener un potencial enorme en lo que concierne a la ejecución de acciones con equipamientos de precisión o necesitados de un adiestramiento complejo, sea en quirófanos, en recintos industriales o logísticos, se fundamenta en el uso de la realidad aumentada como un soporte visual para la toma de decisiones o la ejecución de instrucciones basadas en el intercambio de información entre el usuario y su soporte remoto.
Adicionalmente, la docencia y la investigación se benefician de las representaciones visuales multidimensionales, particularmente útiles en tareas de diseño, como demuestran los trabajos del profesor de la Escuela de Arquitectura de la Universidad de Navarra, Javier Antón. En el ámbito de la seguridad pública, concretamente del reconocimiento facial y de la videovigilancia, la notable mejora de la resolución derivada del mayor ancho de banda de 5G anticipa una capacidad de reacción ante alertas derivadas del tratamiento inmediato de la información obtenida por el agente o en el punto de control móvil en el caso por ejemplo del transporte público colectivo. Naturalmente, en lo que concierne al entretenimiento masivo en movilidad y particularmente el asociado a juegos en línea, el menor retardo ofrecido por 5G hace posible una experiencia de uso que apoyada en la esperada mayor cercanía de los centros de procesamiento de datos (en una situación parecida al alojamiento de los servidores de los proveedores de vídeo como Amazon, HBO o Netflix en las centrales de cabecera de las redes de fibra a los hogares de los operadores) que se aproximará a la que permiten las consolas en el ámbito doméstico, con un dispositivo de usuario que genera una desconcertante presencia en un mundo virtual de tres dimensiones, susceptible de incorporar un sistema de reconocimiento de emociones, cuya regulación está prevista en el proyecto de ley europea de inteligencia artificial y al que ya en 2012 dedicó su proyecto de fin de carrera en la Universidad de Zaragoza Antonio Loscertales Albiol, describiendo el reconocimiento facial automático de emociones basado en vídeos y que en la actualidad alcanza al análisis de la actividad neuronal en entornos de experimentación y más recientemente explorado por investigadores del Instituto de Ciencia y Tecnología de Japón dirigidos por Kazunori Kotani, asociando imágenes de expresiones faciales con la generación de emociones complejas.
Justamente la evaluación de las respuestas y reacciones instantáneas del agente en base a su reconocimiento de la realidad provista por las nuevas telecomunicaciones audiovisuales suscita cuestiones relativas a la protección de derechos fundamentales (señaladamente a la intimidad y en última instancia y en sentido amplio a la libertad) cuya eventual regulación y tutela es objeto de discrepancias entre los estudiosos de un amplio espectro de disciplinas y los líderes de los Estados e instituciones de la Unión Europea, en su particular empeño por anticipar abusos y desviaciones del propósito original de facilitar el acceso a tecnologías que contribuyan al bienestar colectivo. En esta misma línea se movería la iniciativa de la UIT (entidad consultiva de Naciones Unidas para el establecimiento de referencias técnicas básicas en las telecomunicaciones) de crear un grupo de trabajo que elabore un guión para la fijación de estándares para el metaverso, que se reunirá por vez primera bajo los auspicios del gobierno árabe en Riad el próximo 8 de marzo, con cuatro ejes de atención (interoperabilidad, calidad de experiencia de uso, seguridad y protección de datos personales) que conciernen en gran medida igualmente a las telecomunicaciones audiovisuales, si bien el uso del protocolo de Internet y la profusión de plataformas de descargas libres y las redes sociales de última generación han obviado hasta ahora cualquier potencial restricción a la difusión y al aprovechamiento de informaciones de uso mediando previo consentimiento.
En la medida en que el aseguramiento de posibles obligaciones derivadas de las conclusiones de los cuatro ejes de atención concierne a diferentes agentes (operadores, creadores de contenidos, gestores de datos en servidores propios o de terceros, supervisores de ciberseguridad y agencias públicas de protección de datos) y las sensibilidades ante estas cuestiones varían igualmente en función del alcance que se dé a los derechos fundamentales de libertad de expresión, a la intimidad y a la libertad de mercado por parte de los 193 Estados miembros de la UIT, es previsible una amplia disparidad tanto en las aplicaciones disponibles como en la inversión en régimen de competencia en las infraestructuras necesarias para proveer los usos esperados.
Fuente: El Economista