back to top
viernes, enero 10, 2025

Cómo extraer el texto de una imagen usando el OCR de ChatGPT

- Advertisement -

Lo primero que debemos tener en cuenta es que ChatGPT sólo puede reconocer el texto de las imágenes y documentos que subimos a su plataforma, y ​​esto sólo lo podemos hacer desde ChatGPT Plususando el modelo GPT-4.

Una vez subamos el archivo, ChatGPT se encargará de analizarloy no necesitamos decirle específicamente que queremos que lea su contenido, el sistema de Inteligencia Artificial ya se encarga de hacerlo de forma automática.

Veamos un ejemplo con una imagen que contiene código fuente:

En este caso subí una imagen de un programa que estaba dando error, y ChatGPT pudo reconocer el código y ofrecerme una solución adecuada al problema que tenía.

Pero no sólo es capaz de entender lírica perfectamente definido, también puedes hacerlo con letras manuscritas (con ciertos límites) o letras en disposición vertical o inclinada.

Cómo extraer el texto de una imagen usando el OCR de ChatGPT

Veamos otro ejemplo:

Fíjate que en este caso la letra es terrible, no tiene forma ni estructura definida. Las “e” son diferentes en cada palabra, nada está alineado con nada, pero aún así ChatGPT es capaz de juntar los píxeles de la imagen y llegar a la conclusión de que son letras. El comando “Transcribe esto” es apropiado para que puedas transformar el contenido en texto.

La herramienta OCR que se integra con ChatGPT puede tener múltiples usosespecialmente en campos donde es necesario convertir grandes cantidades de documentos impresos o escritos a mano en texto editable y analizable. A continuación se muestran algunas aplicaciones:

El uso de OCR con ChatGPT combina las capacidades de generación y comprensión de texto del modelo de lenguaje con la capacidad de interactuar y procesar información visual.lo que amplía significativamente las aplicaciones y contextos en los que se puede utilizar. Una vez extraído el texto de la imagen, podrás trabajar con ella de la misma forma que si hubieras introducido el texto a mano.

OCR es una tecnología poderosa, pero como todas las tecnologías, tiene limitaciones. Algunos de estos incluyen:

Como ves, nada es perfecto, pero si preparamos bien la imagen antes de enviarla a ChatGPT, las posibilidades de éxito serán altas.


Fuente Informativa

- Advertisement -

Comparte el Post:

Las Calientes

Artículos Relacionados
Related