Microsoft está trabajando en un nuevo modelo de lenguaje de IA a gran escala llamado MAI-1, que potencialmente podría rivalizar con los modelos de última generación de Google, Anthropic y OpenAI, según un informe de Información. Esta es la primera vez que Microsoft desarrolla un modelo interno de IA de esta escala desde que invirtió más de 10 mil millones de dólares en OpenAI para asegurarse el derecho a reutilizar los modelos de IA de la startup. GPT-4 de OpenAI impulsa no solo ChatGPT sino también Microsoft Copilot.
El desarrollo de MAI-1 está dirigido por Mustafa Suleyman, el exlíder de IA de Google que recientemente se desempeñó como director ejecutivo de la startup de IA Inflection antes de que Microsoft adquiriera la mayor parte del personal y la propiedad intelectual de la startup por 650 millones de dólares en marzo. Bien que MAI-1 puisse s'appuyer sur des techniques apportées par l'ancien personnel d'Inflection, il s'agirait d'un tout nouveau modèle de langage étendu (LLM), comme l'ont confirmé deux employés de Microsoft familiers avec el proyecto.
Con alrededor de 500 mil millones de parámetros, MAI-1 será significativamente más grande que los modelos anteriores de código abierto de Microsoft (como Phi-3, sobre el cual informamos el mes pasado), lo que requerirá más potencia informática y datos de entrenamiento. Esto colocaría a MAI-1 en una liga similar al GPT-4 de OpenAI, que es rumor con más de 1 billón de parámetros (en una configuración experta mixta) y muy por encima de modelos más pequeños como los modelos de 70 mil millones de parámetros de Meta y Mistral.
El desarrollo de MAI-1 sugiere un enfoque dual hacia la IA dentro de Microsoft, centrándose tanto en modelos de lenguaje pequeño ejecutados localmente para dispositivos móviles como en modelos de vanguardia más grandes impulsados por la nube. Según se informa, Apple está explorando un enfoque similar. También subraya el deseo de la compañía de explorar el desarrollo de la IA independientemente de OpenAI, cuya tecnología actualmente impulsa las funciones de IA generativa más ambiciosas de Microsoft, incluido un chatbot integrado en Windows.
Al parecer, el propósito exacto de MAI-1 no ha sido determinado (ni siquiera dentro de Microsoft), y su uso más ideal dependerá de su rendimiento, según una de las fuentes de The Information. Para entrenar el modelo, Microsoft asignó un gran grupo de servidores con GPU Nvidia y recopiló datos de entrenamiento de varias fuentes, incluido texto generado por GPT-4 de OpenAI y datos públicos de Internet.
Dependiendo del progreso en las próximas semanas, The Information informa que Microsoft podría obtener una vista previa de MAI-1 ya en su conferencia de desarrolladores Build a finales de este mes, como informa una de las fuentes citadas por la publicación.
«Defensor de los viajes extremos. Amante del café. Experto en tocino total. Wannabe tv pionero».
También te puede interesar
-
Samsung podría dividir notificaciones y configuraciones rápidas en Android 15
-
Los primeros videos de desmontaje del Galaxy Z Flip6 muestran las baterías más grandes y la nueva cámara de vapor
-
Google TV en televisores, la aplicación de Android ya no permite comprar programas de TV
-
[Video] Ajuste ángulos de forma remota, capture hasta los detalles más pequeños: nuevas formas de crear – Samsung Newsroom México
-
El iPhone SE 4 podría compartir el mismo diseño que el iPhone 16, sugiere una nueva filtración