El plan B siempre estuvo listo: Copilot CLI
Microsoft tiene su propia alternativa: GitHub Copilot CLI. Es peor — la comunidad lo sabe, los propios devs de Microsoft lo sabían durante el benchmark. Pero es de Microsoft.
Fijaos en lo que dijo Rajesh Jha (Microsoft) al announcement: "The product can be shaped directly with GitHub for Microsoft's engineering needs."
Shaped. Adaptado. Configurado. Los 20.000 engineers que se vean forzados a usarlo van a generar datos de uso real, patrones, edge cases, failures. Eso es feedback que Copilot CLI necesita para ponerse al nivel de Claude Code.
Microsoft no ha perdido contra Anthropic. Ha decidido que sus engineers son el campo de entrenamiento para su propia herramienta. Sin coste adicional. Sin admitirlo.
"Claude Code is being phased out... since GHCP cli is good enough (reached parity if not better imo) and we want engineers on our products for various reasons..."
— Comentario en r/AIGuild
"we want engineers on our products." Eso. Eso es la razón. No el coste. El ownership.
Las reacciones que lo confirman
En r/theprimeagen, el post acumuló 391 upvotes y 156 comentarios en 24 horas. En r/ClaudeCode, desarrolladores de Microsoft explicaban que sus contextos — meses de conversaciones, código generado, patrones aprendidos — desaparecían en 45 días sin migración asistida.
El tema recurrente: "La herramienta que funcionaba mejor fue la que mataron."
Por qué esto te afecta aunque no trabajes en Microsoft
Microsoft no es la única empresa que está recapacitando sobre dependencies de IA. La factura del crédito infinito es real — pero es el síntoma, no la enfermedad. La enfermedad es construir procesos críticos sobre herramientas de terceros sin control sobre el pricing, la disponibilidad o el ownership de los datos.
La pregunta que deberías hacerte no es "cómo pago menos por Claude Code". Es: ¿qué pasa si mi herramienta de IA me abandona mañana?
Las empresas que sobrevivan esta etapa no son las que encontraron el vendor más barato. Son las que diseñaron su stack para no depender de uno solo.
En la Zona B te explico cómo montar una alternativa local funcional por ~600€ que cubre el 80% de los code tasks del día a día. No es teoría. Son datos reales de nuestro equipo.
[ZONA B — CONTENIDO PREMIUM]
Benchmark real: code agent local por 600€
El equipo de Pirinai montó un entorno de test con un PC Gaming con RTX 5090 y Ollama. Dos modelos: Qwen 2.5 Coder 7B (code specialist) y Gemma 4 26B (generalist de Google).
graph LR
A[PC Test<br/>RTX 5090 32GB<br/>Ollama] --> B[Qwen 2.5 Coder<br/>7B<br/>4.4GB]
A --> C[Gemma 4<br/>26B<br/>18GB]
7 problemas reales de código, prompts verbatim, sin cherry-picking.
Problema 1 — Algoritmo
Write a Python function def two_sum(nums, target): that uses a hash map.
Type hints. Docstring. Short.
| Modelo |
Resultado |
Latencia |
| Qwen 2.5 Coder 7B |
✅ Hash map correcto, Tuple return, ValueError |
9.9s |
| Gemma 4 26B |
✅ Correcto, más simple |
25.2s |
Problema 2 — Bug finding
Find the bug: user[id] == user_id (should be user["id"])
| Modelo |
Resultado |
| Qwen 2.5 Coder 7B |
✅ Detects NameError + missing validation |
| Gemma 4 26B |
✅ Detects en 1 frase |
Problema 3 — Security
List 2 security issues in Flask @app.route("/download") with user-controlled filename
| Modelo |
Resultado |
| Qwen 2.5 Coder 7B |
✅ Path traversal + file existence check |
| Gemma 4 26B |
✅ Path traversal + attack examples |
Problema 4 — React hooks
Convert class React component to functional with hooks
Qwen: ✅ useState + useEffect + optional chaining + dependency array correcto
Problema 5 — Race condition
Identify race condition and propose fix for this counter increment
Qwen: ✅ Lock() con with self.lock: + join statements. Solución completa.
Problema 6 — Code review multi-archivo
4 issues encontrados por Qwen: SECRET_KEY hardcoded, SQL Injection, Missing validation, MD5 passwords. 4/4 con fixes.
Problema 7 — Diseño de arquitectura
Prompt: sistema de notificaciones con 1M WebSocket connections, Redis, PostgreSQL, APNs, FCM.
| Modelo |
Calidad |
Notas |
| Qwen 2.5 Coder 7B |
⚠️ Genérico |
Componentes correctos pero sin profundidad |
| Gemma 4 26B |
✅ Detallado |
Consistent hashing, partitioned queues, autoscaling |
Tabla comparativa: lo que testó nuestro equipo
|
Qwen 2.5 Coder 7B |
Gemma 4 26B |
| Tamaño |
4.4GB |
18GB |
| Velocidad |
~42 tok/s |
~25 tok/s |
| Thinking overhead |
No |
Sí |
| Context window |
128K nativa |
262K |
| Code tasks |
★★★★★ |
★★★★☆ |
| Arquitectura |
★★★☆☆ |
★★★★★ |
| VRAM mínima |
6GB |
20GB |
Comparativa: Claude Code cloud vs modelos locales
| Aspecto |
Claude Code |
Qwen 2.5 Coder local |
| Coste mensual |
$100+ por usuario |
~$0 + electricidad |
| Velocidad |
Depende de la nube |
~42 tok/s |
| Sin conexión |
No |
Sí |
| Privacidad código |
Va a servers de Anthropic |
Nunca sale de tu máquina |
| Context window |
200K |
128K |
| Code tasks cotidianos |
★★★★★ |
★★★★★ |
| Setup |
Trivial |
Media (Ollama + modelo) |
Claude Code cloud — la situación actual de la mayoría
- $100+/mes por usuario
- Código en servers de terceros
- Contexto 200K tokens
- Reasoning de nivel alto
- No funciona offline
- Dependes de que el vendor quiera seguir sirviéndote
Qwen 2.5 Coder local — la alternativa del equipo Pirinai
- $0 en tokens
- Código nunca sale de tu máquina
- Conocimiento de código sólido
- Daily driver para código cotidiano
- Requiere hardware con VRAM
- Control total: tú decides cuándo actualizas, qué modelo usas, qué context tienes
Cuándo NO es suficiente la alternativa local
No todo vale para local. Si tu equipo necesita:
- Code review de repos de +50K líneas — el context window de 200K y el reasoning de Sonnet marcan diferencia real en volumen
- Problemas de arquitectura compleja — donde la diferencia entre un 7B y un 70B se nota en días de trabajo
- Debugging de sistemas distribuidos — donde el reasoning multi-nivel de Anthropic gana por goleada
El verdict de nuestro equipo
El 70-80% de los tasks de código del día a día se pueden resolver en local. El 20-30% restante — arquitectura compleja, debugging de sistemas grandes, reasoning multi-nivel — sigue mereciendo la factura de cloud.
La diferencia con Microsoft: ellos tenían el poder de negociación para haber conseguido un deal razonable con Anthropic. Decidieron que no querían deal. Querían no depender. Deberías aplicar la misma lógica en tu empresa.
Referencias
[1] Tom Warren, The Verge — "Microsoft starts canceling Claude Code licenses" (May 14, 2026)
[2] The Verge — "very popular, perhaps a little too popular" — fuentes internas en Microsoft sobre el benchmark
[3] @rentierdigital, Medium — "Microsoft Just Killed Claude Code Internally. Their Own Devs Loved It."
[4] The Information — "Uber's CTO says full-year AI budget gone in April"
[5] Janakiram MSV, Forbes — "Uber Burns Its 2026 AI Budget In Four Months On Claude Code" (May 17, 2026)
[6] GitHub Blog — "GitHub Copilot is moving to usage-based billing" (April 2026)
[7] r/ClaudeCode — "Microsoft just pulled Claude Code licenses from thousands of developers" (392 upvotes, 156 comentarios)
[8] r/AIGuild — "Microsoft Is Pulling Back Claude Code Licenses" thread
[9] r/LocalLLaMA — "Claude Code removed from Claude Pro plan — better time than ever to switch to Local Models" (2.000+ upvotes)