La semana pasada, Google le dio un buen repaso a la oferta de LLM (Grandes Modelos de Lenguaje) en Gemini. Los usuarios de cuentas gratuitas dijeron adiós a los modelos 1.5 y la bienvenida a 2.0 Flash2.0 Flash Thinking (experimental), las Gems de Gemini y la función Deep Research, mientras que los suscriptores de Gemini Advanced ganaron el modelo 2.0 Pro (Experimental).

Entre todas estas novedades, pasó desapercibido que Gemini 2.0 Flash pasaba a contar con generación nativa de imágenes, pero con una diferencia muy importante frente a competidores como ChatGPT, que las crea mediante DALL-E: no solo genera imágenes a partir de un prompt, sino que el usuario también puede subirlas y editarlas.

Como si estuviera usando Photoshop, pero mediante lenguaje natural y pidiéndole con instrucciones escritas lo que quiere en cada momento. No es una capacidad aún perfecta, pero sí funciona razonablemente bien y pone la edición de imágenes al alcance de cualquiera, sin necesidad de ningún software caro y complicado de usar.

MAS AQUI

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Sondeo Latino . Net
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.