La problemática de los Open LLMs
Navegando entre gigantes: la batalla por la democracia digital en el mundo de los Open LLMs
La esfera de los Modelos de Lenguaje Grande de código abierto (Open LLMs) está viviendo una era de innovación y progreso sin precedentes, lo que augura un futuro donde el dominio de los Open LLMs podría ser monopolizado por gigantes tecnológicos como OpenAI, a menos que se tomen medidas adecuadas. La comunidad de código abierto, impulsada por modelos más pequeños y eficientes, está liderando esta ola de innovación, con empresas empleando Open LLMs para brindar servicios y APIs valiosas.

A nivel general, en palabras de Bindu Reddy (@bindureddy), que el universo Open Source para los LLMs será imbatible para muchas de las empresas que se dedican a esto, excepto para OpenAI. El ritmo de la innovación y la investigación de LLM de código abierto es impresionante y por qué pasa esto:
- La comunidad de código abierto es mucho más gran de que cualquier empresa específica.
- La lobotomía de seguridad y el miedo a la mala prensa continuarán afectando el rendimiento del modelo patentado.
- Los modelos más pequeños que están instruidos/afinados funcionan tan bien como los modelos 50 veces más grandes
- Los modelos más pequeños son más eficientes y más baratos que los modelos grandes.
- Las empresas aprovecharán el código abierto y ofrecerán API y servicios de valor añadido.
Sin embargo, se enfrentan a desafíos considerables, especialmente en lo que respecta a la retroalimentación humana necesaria para el perfeccionamiento y alineación de estos modelos. La falta de organización y coordinación en la comunidad de Open LLMs para compartir retroalimentación humana, un recurso que gigantes como OpenAI, Anthropic y Bard tienen en abundancia debido a sus extensas bases de usuarios. Como destaca Soumith Chintala que los modelos de lenguaje abiertos deben coordinarse para compartir retroalimentación humana a gran escala, que es esencial para su alineación ética. Sin embargo, las licencias abiertas por sí solas pueden no ser suficientes, se necesitan también compromisos corporativos.

Yann LeCun (@ylecun) propone una solución en forma de retroalimentación humana crowdsourced, al estilo de Wikipedia, permitiendo que los LLMs se transformen en repositorios de conocimiento y cultura humanos. David A. Johnston respalda esta idea y presenta a Morpheus, una plataforma que recompensa a los usuarios por contribuir con datos y retroalimentación humana, ofreciendo una solución viable para mejorar los Open LLMs.

Morpheus se posiciona como una red diseñada para alimentar Agentes Inteligentes en un entorno peer-to-peer, abriendo las puertas del mundo Web3 a todos los usuarios. Algunos de los anhelos de Yann LeCun los ponen en marcha. La red Morpheus integra un token, MOR, para incentivar a los contribuyentes clave, incluyendo a los usuarios que proporcionan datos, los desarrolladores que contribuyen con software, y aquellos que proporcionan capital y recursos computacionales. Esta iniciativa busca descentralizar la infraestructura necesaria para hacer accesibles los Agentes Inteligentes a todos, ofreciendo una alternativa de código abierto robusta a los modelos GPT cerrados proporcionados por gigantes tecnológicos como OpenAI, Microsoft y Google.
Morpheus aborda también la falta de interfaces gráficas de usuario estándar, APIs para desarrolladores y soluciones en la nube en los Open LLMs existentes, proporcionando una plataforma donde los usuarios pueden interactuar con los modelos, y los desarrolladores pueden construir y mejorar los LLMs. Además, propone un sistema de recompensas basado en tokens para incentivar la contribución y participación en la red, promoviendo un ciclo virtuoso de mejora y expansión de los Open LLMs.
El modelo económico de Morpheus, respaldado por su token MOR, se centra en recompensar a la comunidad, los codificadores, los proveedores de capital y computación, reflejando una estructura descentralizada que fomenta la colaboración y contribución activa. Este enfoque aspira a sostener y crecer la red Morpheus a largo plazo, proporcionando una infraestructura sólida para el desarrollo y mejora de los Open LLMs.
Con estrategias como las propuestas por Morpheus, los Open LLMs podrían superar los desafíos actuales relacionados con la retroalimentación humana y la coordinación comunitaria, permitiendo que la comunidad de código abierto continúe innovando y avanzando en la investigación y desarrollo de LLMs, mientras proporciona soluciones valiosas y descentralizadas en el emergente mundo de la Web3. Esta perspectiva refleja la importancia de una colaboración efectiva y la adopción de estrategias inclusivas y descentralizadas para asegurar que los Open LLMs sigan siendo una fuente de innovación y valor en el ámbito de la tecnología de lenguaje natural.
Video realizado con Invideo AI: Navigation the Open Seas of Language Models: A voyage into the future