#3 Últimas noticias 06/08/2023

Noticias de IA para desarrolladores

Pedro Fernández
August 06, 2023

Hola a todos,

Después de dos semanas de noticias, este es un breve resumen de temas interesantes para desarrolladores con:

¿Qué debería saber un desarrollador sobre IA estas semanas?
Herramientas de IA que te pueden ayudar en el desarrollo
Posiciones para IA para desarrolladores - OpenAI

Qué disfrutéis!

Y antes de seguir leyendo, si queréis aprender otras habilidades, os recomendamos una newsletter muy interesante con contenidos básicos relacionados con el marketing:

¿Qué debería saber un desarrollador sobre IA estas semanas?

Actualizaciones en ChatGPT + Stability

Como desarrollador es importante conocer como evolucionan y que nos ofrecen los modelos más importante, los basados en texto como los basados en imágenes. Recordad que en muchos casos podemos utilizar su API y darle muchísimo más poder a nuestras aplicaciones.

Actualización de ChatGPT orientada a facilitar la experiencia con el modelo. Aún así, tened en cuenta que muchos de estos cambios solamente están disponibles si eres usuario de subscripción Plus (20 $/mes) que sacaron el pasado Febrero.

GPT-4 por defecto. Recordad que GPT-4 estaba disponible bajo invitación y que el modelo por defecto que utilizaba esta GPT-3.5, con un comportamiento mucho peor.
Permite subir y trabajar con varios ficheros en el Code Interpreter. Esta funcionalidad está orientada como la solución para facilitar el trabajo de analistas (p.e. datos, financieros, etc)
Mayor guía con prompts y respuestas sugeridas, con el objetivo de eliminar la página en blanco y facilitar sugerencias sobre cómo continuar la conversación y mantener una diálogo más fluido.
Atajos de keyboard específicos de ChatGPT, que permiten trabajar más rápidamente y facilita la investigación de prompts de manera más ágil.for using ChatGPT.

Versión de Stable Diffusion XL 1.0. Uno de los modelos text-to-imagen y empresa que más ha dado que hablar en este ámbito, ha comunicado que se trata del modelo más avanzado hasta el momento con 3.5 billones de parámetros y capacidad casi instantánea para generar imágenes de 1 mega píxel de resolución.

El modelo admite inpainting (reconstrucción de partes faltantes de una imagen), outpainting (extensión de imágenes existentes) y las indicaciones de image-to-image, lo que significa que los usuarios pueden ingresar una imagen y agregar algunas indicaciones de texto para crear variaciones más detalladas de esa imagen.

Entre sus principales novedades se encuentran varios detalles interesantes:

Modelos con mayor foto-realismos.
Nueva composición de imagen y generación de caras.
Utilización de prompts más cortos para la creación de imágenes más descriptivas.
Mayor capacidad para producir texto legible.
Imágenes más ricas visualmente, con una estética más asombrosa.

Aquí podéis ver la información completa, éste es sólo uno de los ejemplos generados con esta nueva versión:

Ejemplo del nuevo modelo Stable Diffusion XL

Recordad que podéis probar los modelos de Stable Diffusion de manera gratuita y generar vuestras propias imágenes en su DreamStudio

Problemas con las herramientas para detectar AI

Una de las preocupaciones que se ciernen sobre los modelos de lenguaje es la capacidad de diferenciarlos de texto real producido por los seres humanos. Distintos enfoques han intentado aplicar la teoría de que el texto generado por IA tiene alguna característica o patrón de identificación que se puede detectar de manera confiable. Y para eso, al mismo tiempo, entrenan modelos de deep learning con los textos producidos por los modelos de lenguaje.

Uno de los lanzamientos vino de la propia Open AI, con su AI Classifier (donde en las propias notas de OpenAI parece que el success rate que manejan eran del 26%), con otras compañías como Turnitin, GPTZero, Originality.ai, ZeroGPT o CatchGPT ofreciendo soluciones similares.

Input de GTPZero para la detección de texto generado por IA

Aunque algunos textos generados pueden tener una indicación obvia, las diferencias entre los grandes modelos de lenguaje y la rapidez con la que se han desarrollado han hecho que sea prácticamente imposible confiar en esas indicaciones.

Después de llegar a la conclusión de que los enfoques y herramientas actuales no funcionan, que los estrategias sobre los mecanismos de detección son especulativos y no probados, y que, además, genere falsos positivos (por ejemplo, en los trabajos de varios estudiantes en universidades americanas), OpenAI ha decidido parar el desarrollo de su herramienta AI Classifier. Nos los cuentan TechCrunch y ArsTechnica.

Shopify sigue apostando por la AI generativa: Sidekick

Si hace dos semanas explicábamos que los modelos de lenguaje llegaban también a la generación de portales de e-commerce y Wix anunciaba un generador de apoyo a sus herramientas no code, esta vez es su competidor Shopify quien anuncia Sidekick.

Sidekick es un chatbot de inteligencia artificial que puede ayudar a los e-commerce a rediseñar sus sitios web y analizar los datos de ventas. Basado en el modelo de OpenAI GPT-4, permite 1) rediseñar el layout y funcionamiento de su web y los productos (p.e. descuentos); 2) responder preguntas analíticas sobre el funcionamiento de la tienda.

Sidekick se está implementando junto con otras características nuevas dentro de Shopify, que no es la primera vez que apuesta por combinar este tipo de tecnologías dentro de su suite denominada Shopify Magic, muy enfocada a la automatización de tareas como la descripción de productos en los listados o la generación de imágenes de los productos.

La verdad es que es imparable: viendo todo este tipo de movimientos, no es muy difícil comprender que la mejor manera de adaptarse es conocer el funcionamiento de estos modelos de cara a poder aprovecharlos dentro de nuestro día a día como desarrolladores. Cada vez habrá una parte más automatizada, combinada parcialmente o mayoritaria mente por estos modelos, con pasos finales para ajustar los detalles específicos que no funcionen dentro del problema a responder.

Herramientas de IA que te pueden ayudar en el desarrollo

Overture Maps Foundation

Una iniciativa muy interesante si habéis trabajado con mapas o puntos de interés (POIs, en inglés), puesto que sabréis de las dificultades y limitaciones a la hora de poder utilizar este tipo de información.

Aunque ha habido enfoques y disponibilidad de datos en distintos momentos y maneras (Foursquare, Google Places, Facebook ...), la realidad es que a medida que los requisitos de precisión, actualidad y atribución en los mapas han crecido para satisfacer las necesidades de los usuarios, los costes y las complejidades de recopilar y mantener datos de mapas globales han crecido más allá de la capacidad de una sola organización.

Bajo esta premisa nace la Overture Maps Foundation en Diciembre de 2022 con Amazon Web Services (AWS), Meta, Microsoft, y TomTom, como socios iniciales y que incluye hoy en día a una docena adicional de compañías de mapas, soluciones geoespaciales y tecnología. La colaboración se basa en la premisa de que los datos de mapas deben ser un activo compartido para admitir aplicaciones futuras.

Overture Maps Foundation ha lanzado ha lanzando un primer data sets que incluye las cuatro capas de datos únicas de lugares de interés (POI), edificios, red de transporte y límites administrativos. Estas capas, que combinan varias fuentes de datos de mapas abiertos, se han validado y combinado a través de una serie de controles de calidad y se publican en el esquema de datos de Overture Maps que se lanzó públicamente en junio de 2023. El conjunto de datos de Places incluye datos sobre más de 59 millones de lugares en todo el mundo y será un elemento fundamental de la navegación, la búsqueda local y muchas otras aplicaciones basadas en la ubicación. Los conjuntos de datos están disponibles para descargar aquí.

Frameworks para trabajar con LLMs

Aunque LangChain se ha convertido en un standard de facto dentro del stack de aplicaciones para desarrollar aplicaciones LLMs, ya explicábamos en un post anterior que había habido cierto revuelo en el mundo de desarrolladores sobre su diseño, su complejidad más allá de las recetas del cookbook y su validez en producción.

Aún así, los objetivos que persigue son muy lógicos y se han aplicado en otros momentos a la hora de diseñar frameworks que hicieran de capa de intermediación con varias implementación:

Facilitar el desarrollo de aplicaciones utilizando las características generales del área, más allá de las distintas implementaciones, APIs, SDKs ... que cada una de ellas pudiera tener.
Facilitar el cambio entre distintas de esas implementaciones sin tener que cambiar la implementación específica de tu aplicación, más allá de elementos de configuración específicos (p.e. URLs de los end points, nombre de la plataforma, etc.)
Facilitar la extensión con nuevas funcionalidades generales, por encima de las disponibles en cada una de las implementaciones específicas.

De esa manera, en tiempo iniciales aparecieron alternativas como LlamaIndex (anteriormente llamada GPTIndex), que cubrían aspectos bastante similares o cada vez aparecen soluciones nuevas que intentan servir como capa unificadora como EasyLLM, SlashGPT o Kor (todos estos en python, por cierto).

Posiciones para IA para desarrolladores - OpenAI

Se que muchas veces nos da algo de miedo algunas empresas y algunos puestos, pero hoy nos vamos a detener un rato en algunas posiciones dentro de OpenAI que creo que pueden ser muy interesantes para conocer el mercado y las expectativas.

Full-stack Engineer, Partnership. OpenAI, enlace. Es en San Francisco, con un rango salarial entre $245,000 – $370,000 + compensación con equity y benefits
Full-stack Developer, Communication & Design. OpenAI, enlace. San Francisco, con un rango salarial entre $200,000 – $255,000 + compensación con equity y benefits
Full-stack Developer, Communication & Design. OpenAI, enlace. San Francisco, con un rango salarial entre $200,000 – $255,000 + compensación con equity y benefits

En la audiencia de esta newsletter también tenemos otros perfiles o perfiles que están pensando en cambiar:

Product Manager, API Experience. OpenAI, enlace. San Francisco, con un rango salarial entre $240,000 – $370,000 + compensación con equity y benefits
Data Scientist, Developer Platform. OpenAI, enlace. San Francisco, con un rango salarial entre $240,000 – $370,000 + compensación con equity y benefits
Engineer Manager, Data Platform. OpenAI, enlace. San Francisco, con un rango salarial entre $240,000 – $370,000 + compensación con equity y benefits

Espero que haya sido interesante, nos vemos en la próxima.