Microsoft presenta Fara1.5: agentes IA que superan a Operator y Gemini 2.5
22 de mayo de 2026 · Fuente original: MarkTechPost
Microsoft Research lanzó Fara1.5, una familia de agentes IA capaces de navegar navegadores web en tres tamaños (4B, 9B, 27B parámetros). El modelo más grande alcanza 72% de precisión en el benchmark Online-Mind2Web, superando a OpenAI Operator y Gemini 2.5 Computer Use.
El avance de los agentes para automatización web
Microsoft Research ha presentado Fara1.5, una línea de modelos de lenguaje especializados en realizar tareas de interacción con navegadores web de forma autónoma. Estos agentes representan un paso significativo en la automatización de procesos digitales, combinando capacidades de comprensión visual, razonamiento lógico y control de interfaces gráficas.
Arquitectura y desempeño del modelo
La familia Fara1.5 está disponible en tres variantes: 4B (4 mil millones de parámetros), 9B y 27B parámetros. La versión más grande, Fara1.5-27B, logró una precisión del 72% en el benchmark Online-Mind2Web, una métrica que evalúa la capacidad del modelo para completar tareas complejas de navegación web con múltiples pasos. Este desempeño supera significativamente a competidores de mercado como OpenAI Operator, Gemini 2.5 Computer Use y Yutori Navigator n1.
Lo relevante técnicamente es que estos modelos pueden interpretar pantallas, comprender el contexto de una página web y ejecutar clics, escritura de texto y navegación sin intervención humana.
Pipeline de datos sintéticos FaraGen1.5
Microsoft también introdujo FaraGen1.5, un pipeline de generación de datos sintéticos que juega un papel crucial en el entrenamiento de estos agentes. Esta herramienta permite crear grandes volúmenes de datos de entrenamiento de forma controlada, mejorando la capacidad del modelo para generalizar a nuevas situaciones sin ver exactamente esos ejemplos durante el aprendizaje. El enfoque sintético reduce dependencias de datos reales anotados manualmente, acelerando el ciclo de iteración y mejora.
Implicaciones para automatización industrial en Latinoamérica
En contextos de manufactura y operaciones, estos agentes podrían integrarse en flujos de trabajo para automatizar acciones repetitivas en sistemas legacy o aplicaciones web empresariales. Por ejemplo, en plantas de procesamiento, un agente Fara1.5 podría completar órdenes de compra en portales proveedores, consolidar reportes desde múltiples bases de datos web o realizar auditorías digitales sin que un operario dedique horas a tareas manuales.
La disponibilidad de modelos más pequeños (4B, 9B) es particularmente valiosa para empresas con recursos computacionales limitados o que buscan desplegar en edge computing local. Un modelo de 9B parámetros puede ejecutarse en una estación de trabajo moderna sin necesidad de infraestructura en la nube costosa.
Perspectiva competitiva
El lanzamiento de Fara1.5 refleja la intensificación de la competencia en el espacio de agentes de computadora. OpenAI, Google y ahora Microsoft están invirtiendo en esta categoría porque las aplicaciones comerciales son inmediatas: automatización de procesos comerciales (BPA), testing de software, soporte técnico asistido por IA y recopilación de inteligencia de negocios.
Para organizaciones en la región, esta carrera tecnológica representa oportunidades para adoptar soluciones de punta sin esperar tres años: el código y modelos de Microsoft tienden a ser accesibles relativamente rápido para desarrolladores que trabajan en Python y frameworks estándar.
Este resumen es un análisis original. Para leer la noticia completa visita la fuente original: MarkTechPost →
Sigue leyendo en Inteligencia Artificial
ClickUp reemplaza empleados con agentes de IA: ¿qué significa para el futuro laboral?
La plataforma de productividad ClickUp despide cientos de trabajadores mientras expande masivamente sus capacidades de automatización mediante agentes de IA. El movimiento refleja una transformación más amplia en cómo las empresas abordan la eficiencia operativa.
Fuente: TechCrunch AI
SuperClaude: Framework avanzado para flujos de trabajo con IA generativa
Tutorial sobre cómo construir flujos de trabajo sofisticados usando SuperClaude, un framework estructurado sobre la API de Anthropic que integra comandos, agentes, modos y memoria de sesión.
Fuente: MarkTechPost
Google lanza Gemini 3.5 Flash: modelo IA 4x más rápido y 50% más económico
Google presentó Gemini 3.5 Flash en su conferencia I/O 2026, un modelo de lenguaje optimizado para agentes de IA y desarrollo de código que supera al modelo insignia en benchmarks relevantes mientras reduce significativamente latencia y costos operativos.
Fuente: MarkTechPost