El científico que detecta deepfakes lleva 25 años preparándose para este momento

A principios de los años 2000, manipular una fotografía digitalmente requería horas de trabajo, software especializado y, sobre todo, tiempo suficiente para dejar rastros. Rastros que un ojo experto podía detectar si sabía dónde mirar. Hany Farid, entonces profesor en el Dartmouth College, decidió que la ciencia forense necesitaba encontrar esos rastros de forma sistemática, no intuitiva. Su pregunta era aparentemente sencilla pero carecía de respuesta: ¿cómo se demuestra, con matemáticas, que una imagen ha sido alterada?

La respuesta tardó años en construirse. Y hoy, cuando los modelos de inteligencia artificial pueden fabricar en segundos un vídeo convincente de cualquier persona diciendo cualquier cosa, esa pregunta es más urgente que nunca. El reportaje publicado recientemente en la revista Science retrata a Farid, ahora profesor de la Universidad de California en Berkeley, como el investigador que construyó las herramientas antes de que existiera el problema a gran escala.

Lo que los ojos no pueden ver

Los deepfakes actuales no funcionan como el Photoshop de los años noventa. No hay un píxel fuera de lugar ni una sombra en la dirección equivocada que cualquier ojo humano, por muy entrenado que esté, pueda identificar a simple vista. Los modelos generativos modernos, basados en arquitecturas como las redes generativas antagónicas (GAN) y, más recientemente, los modelos de difusión, aprenden a imitar la realidad estadística analizando millones de imágenes. El resultado es un contenido sintético que supera con comodidad el umbral de percepción visual.

La trampa no está en lo que se ve. Está en lo que el modelo no sabe que debería ocultar.

Las inconsistencias que delatan un deepfake son, en su mayoría, físicas y estadísticas, imperceptibles sin las herramientas matemáticas adecuadas. Un modelo generativo puede reproducir con fidelidad milimétrica la textura de la piel, el color del iris o el movimiento de los labios. Sin embargo, tiene serias dificultades para replicar la física completa de la luz tridimensional. Los reflejos en los ojos de una persona real siguen leyes ópticas estrictas que los modelos actuales no reproducen de forma consistente. Si analizamos la luz especular que rebota en ambas pupilas, un deepfake a menudo mostrará fuentes de luz que no coinciden geométricamente entre el ojo izquierdo y el derecho.

La frecuencia y el patrón de parpadeo tampoco suelen coincidir con los parámetros biológicos documentados. Además, la geometría tridimensional del rostro, bajo ciertos ángulos de iluminación, introduce distorsiones apenas perceptibles para el ojo, pero mensurables para un algoritmo entrenado para detectarlas en el dominio de las frecuencias espaciales. Ese es el territorio de Farid: la intersección exacta entre la física, la estadística y la visión artificial.

Representación visual de las inconsistencias físicas que los algoritmos de detección forense identifican en imágenes sintéticas generadas por modelos de inteligencia artificial. Fuente: Nano Banana / Scruzcampillo.

La ciencia de la huella digital

El enfoque del laboratorio de Farid no busca directamente lo falso, sino que persigue la ausencia de lo real. Los detectores que su equipo lleva décadas desarrollando aprenden cuáles son las propiedades estadísticas inmutables de las imágenes auténticas capturadas por sensores de hardware, y después identifican desviaciones de esas propiedades en el material sospechoso.

Una cámara digital introduce un patrón de ruido en cada fotografía de una manera específica, determinada por las características físicas del sensor de silicio y el procesado interno del dispositivo (conocido como ruido de patrón fijo o PRNU). Un vídeo real tiene una cadencia de movimiento ocular y de pulso capilar que responde a estímulos biológicos verificables. Una cara real proyecta sombras que obedecen a una fuente de luz única y geométricamente coherente en el espacio 3D. Cada uno de estos patrones constituye una firma estructural que los modelos generativos actuales no consiguen falsificar de forma perfecta y simultánea.

El trabajo de Farid ha trascendido el entorno académico puro. A lo largo de los años, ha colaborado con organismos de aplicación de la ley, plataformas digitales y entidades gubernamentales para desarrollar sistemas de autenticación de contenidos. Ha testificado ante el Congreso de los Estados Unidos sobre los riesgos estructurales de la desinformación basada en medios sintéticos.

Una carrera sin línea de meta y el dividendo del mentiroso

Aquí está la paradoja central del campo forense, y Farid ha sido explícito al respecto: cada avance en la detección provoca, de manera inevitable, un avance paralelo en la generación.

Cuando los investigadores publican un detector, los desarrolladores del siguiente modelo incorporan ese conocimiento. Es la lógica de la carrera armamentística aplicada a la información.

Los detectores son reactivos por construcción. No pueden anticipar una arquitectura generativa que todavía no ha sido entrenada. A esto se suma un fenómeno sociológico que Farid y otros expertos denominan el «dividendo del mentiroso». Cuando el público asume que la inteligencia artificial puede falsificar cualquier vídeo o audio con facilidad, los actores maliciosos ganan una coartada perfecta. Pueden afirmar que una prueba real y comprometedora es, en realidad, un deepfake, sembrando la duda razonable en los tribunales y en la opinión pública.

Esto no convierte la investigación en un esfuerzo inútil, sino en uno cuyos objetivos deben plantearse con precisión quirúrgica. El objetivo real no es una solución definitiva que detecte todo el contenido falso. Es elevar el coste técnico de producir contenido sintético indetectable, crear fricción computacional suficiente para que los atacantes necesiten recursos crecientes, y construir una infraestructura de autenticación paralela.

Lo que la ciencia todavía no puede garantizar

Los límites de la ciencia forense digital son igualmente claros. Los sistemas actuales de detección funcionan con alta precisión sobre modelos generativos conocidos o antiguos, pero su tasa de error aumenta de forma significativa cuando se enfrentan a arquitecturas nuevas o a contenido generado con técnicas ausentes en su conjunto de entrenamiento original. La capacidad de generalización entre distintas familias de redes neuronales sigue siendo un problema técnico abierto.

Detectar un deepfake en un laboratorio controlado y detectarlo en el ecosistema de información real y degradada son dos problemas de orden de magnitud completamente distinto.

La escala es el segundo gran problema irresuelto. Los deepfakes ya no son una curiosidad o una amenaza teórica de laboratorio. Hoy se producen en volúmenes que ningún sistema forense centralizado puede analizar en tiempo real a escala de red social. La detección semisupervisada de contenidos es económicamente inviable al ritmo vertiginoso al que se genera y distribuye la desinformación audiovisual en la actualidad.

Y luego están los falsos positivos. Un detector imperfecto que marca como falso material legítimo puede causar daños irreparables: la desacreditación injusta de documentos de derechos humanos, graves consecuencias legales para periodistas o testigos en zonas de conflicto, y la erosión general de la confianza en los archivos de información pública. En este ámbito de la tecnología, la transparencia sobre los márgenes de error es tan crítica como la sensibilidad del propio detector.

La apuesta por el origen y la criptografía

Ante estos retos, el trabajo más prometedor apunta hoy a un enfoque complementario a la detección a posteriori: la autenticación del origen. En lugar de intentar demostrar mediante análisis estadístico que algo es falso, la idea es construir la infraestructura técnica y legal para demostrar irrefutablemente que algo es real.

La Coalition for Content Provenance and Authenticity (C2PA), de la que forman parte actores clave de la industria, trabaja para que las cámaras, los micrófonos y las plataformas de distribución incrusten de forma nativa metadatos firmados criptográficamente. Estos metadatos certificarían de manera inalterable cuándo, dónde y con qué sensor de hardware físico se capturó un contenido audiovisual.

Si el dispositivo de captura certifica criptográficamente una imagen en el preciso momento de su creación, la carga de la prueba se invierte por completo: el contenido que carezca de certificado no tendrá ninguna garantía de autenticidad por defecto, y el contenido con firma criptográfica podrá verificarse matemáticamente sin depender de un detector reactivo entrenado sobre los modelos del pasado.

Es una carrera completamente abierta. Hany Farid lleva veinticinco años corriendo en ella, estudiando los píxeles y el ruido, y la señal de llegada no está todavía a la vista. Pero al menos, ahora la ciencia forense tiene un mapa del terreno.

Referencias

Farid, H. Trabajos sobre image forensics y autenticación de medios digitales. Perfil académico: https://farid.berkeley.edu
«Deepfakes Are Everywhere. The Godfather of Digital Forensics Is Fighting Back.» Science. AAAS. URL: https://www.science.org/content/article/deepfakes-are-everywhere-godfather-digital-forensics-fighting-back

Fuente informativa⁣

#científico #detecta #deepfakes #lleva #años #preparándose #para #este #momento

Noticias RD

New York

Estilo

Farandula

Tecnología

Cine

Curiocidades

Salud

Mundo

Company

Relacionado

Noticias RD

New York

Estilo

Farandula

Tecnología

Cine

Curiocidades

Salud

Mundo

Company

Relacionado

El científico que detecta deepfakes lleva 25 años preparándose para este momento

Lo que los ojos no pueden ver

La ciencia de la huella digital

Una carrera sin línea de meta y el dividendo del mentiroso

Lo que la ciencia todavía no puede garantizar

La apuesta por el origen y la criptografía

Referencias

Relacionado

El Top Semanal

Post Relacionados

Sondeo Latino News

Últimos artículos

Más Populares