Apple introduce una IA de código abierto para editar imágenes con lenguaje natural

Los avances de Apple en el campo de la inteligencia artificial continúan avanzando, a pesar de las percepciones en contrario. Colaborando con la Universidad de California en Santa Bárbara (UCSB), han desarrollado MGIE, un nuevo modelo de código abierto que permite la edición de imágenes mediante lenguaje natural.

Si bien existen numerosas herramientas en la web para la generación de imágenes mediante inteligencia artificial, el enfoque de Apple y la UCSB se centra en la «edición guiada», aprovechando los modelos de lenguaje multimodales de gran escala (MLLM).

Según los desarrolladores, MGIE interpreta tanto la imagen como las instrucciones del usuario para realizar la edición, incluso sin un contexto detallado. Por ejemplo, al describir una imagen de pizza como «hazla más saludable», la IA agregó tomates y hierbas.

MGIE incorpora un MLLM y un modelo de difusión, que permiten interpretar instrucciones concisas y realizar ediciones de imágenes de manera coherente. Esto demuestra que los modelos de lenguaje multimodales pueden simplificar la edición de imágenes con inteligencia artificial.

El proyecto también aborda la dificultad de comprender instrucciones humanas breves, mejorando el control y la flexibilidad en la edición de imágenes sin requerir descripciones excesivamente detalladas.

Ejemplos prácticos, como la eliminación de elementos en una foto o ajustes locales y globales en la imagen, ilustran la versatilidad de MGIE.

Aunque no se ha confirmado si Apple planea integrar esta IA en sus productos comerciales, demuestra su compromiso con estas tecnologías emergentes, como lo evidencia el reciente lanzamiento de MLX.

Los interesados pueden probar MGIE a través de una versión de prueba en Hugging Face Spaces o descargar información y modelos preentrenados desde GitHub para experimentar por sí mismos.

Cookie	Duración	Descripción
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Lo Mejor Las historias más leídas

¿Cómo aumentar la memoria de Node en Windows?

Bitbucket (vs Github(?))

¿Ganar dinero en línea es posible?, algunos tips

Trending Tags

Apple introduce una IA de código abierto para editar imágenes con lenguaje natural

Publicación anterior

Aprende a vincular dependencias locales con npm link

Siguiente Publicación

Extrabajador de Apple, condenado por robo de secretos del proyecto del Apple Car, enfrentará prisión

Apple introduce una IA de código abierto para editar imágenes con lenguaje natural

Publicación anterior

Siguiente Publicación

Publicaciones Relacionadas

Uso de Cookies