Referencias oficiales: Resumen general · Instalación · Autenticación · GEMINI.md
Por qué Gemini CLI merece una guía aparte
Gemini CLI es el agente de terminal de código abierto de Google. Hoy su propuesta es bastante clara: juntar modelos Gemini, herramientas locales, acceso web y memoria de proyecto en una sola CLI que funciona bien tanto en sesiones interactivas como en automatización.
En un repositorio como este, Gemini CLI destaca especialmente en tres casos:
- Entender repositorios grandes — la ventana de 1M tokens ayuda a hacer lecturas amplias.
- Combinar archivos locales y web — puede leer archivos, ejecutar shell y traer información actual.
- Reutilizar instrucciones —
GEMINI.mdevita repetir el mismo contexto en cada prompt.
Instálalo de la forma práctica
La documentación oficial recomienda Node.js 20+.
# instalación global con npm
npm install -g @google/gemini-cli
# macOS / Linux
brew install gemini-cli
# probar sin instalación permanente
npx @google/gemini-cliElige bien la autenticación
La guía oficial separa claramente varios escenarios:
| Situación | Mejor opción | Nota |
|---|---|---|
| Uso personal en local | Iniciar sesión con Google | Flujo más simple |
| Scripts / CI / headless | API key de Gemini | Configuración fácil con variables de entorno |
| Organización centrada en GCP | Vertex AI | Encaja con controles de Google Cloud |
| Cuenta de empresa / escuela | Login con Google + proyecto | A menudo requiere proyecto de Cloud |
1) Iniciar sesión con Google
geminiLuego elige el flujo de login de Google.
2) Usar una API key de Gemini
Ideal para scripts, jobs headless o configuraciones mínimas:
export GEMINI_API_KEY="YOUR_GEMINI_API_KEY"
gemini3) Usar Vertex AI
Útil cuando el equipo ya trabaja con modelos desde Google Cloud:
export GOOGLE_CLOUD_PROJECT="your-project-id"
export GOOGLE_CLOUD_LOCATION="us-central1"
geminiPrimeros comandos y Flujos de trabajo base
Gemini CLI mejora mucho cuando usas su sintaxis de herramientas en lugar de depender solo de prompts largos.
Interacción básica
# Iniciar modo interactivo
gemini
# Incluir archivos o directorios con @
gemini "@package.json @src explica la arquitectura de la app"
# Ejecutar shell con ! (El agente lee y analiza el resultado)
!npm testFlujo de trabajo central: Investigación -> Estrategia -> Ejecución
No te limites a chatear; guía al agente por fases:
- Investigación (Research): Pide al agente que explore (
grep_search,glob) para mapear el código. - Estrategia (Strategy): Pide un diseño y plan antes de que modifique nada.
- Ejecución (Execution): Permite que aplique cambios precisos (
replace,write_file) y valide.
Aprovechando el Plan Mode (/plan)
Para refactorizaciones o decisiones grandes, es riesgoso dejar que edite de inmediato.
Usa el comando /plan para entrar en Plan Mode. En este modo de solo lectura, el agente no puede modificar archivos ni ejecutar comandos destructivos. Se enfoca en analizar y redactar un plan sólido. Una vez aprobado, vuelve al modo predeterminado para ejecutar de manera segura.
GEMINI.md es donde de verdad se vuelve potente
Gemini CLI carga GEMINI.md de forma jerárquica:
~/.gemini/GEMINI.md(preferencias globales)- archivos del workspace (reglas del proyecto)
- contexto JIT en subdirectorios
Ejemplo de archivo
# Project: AI Native Notes
## Stack
- Next.js 16
- TypeScript
- next-intl
- contenido MDX en /content
## Content rules
- Mantener frontmatter consistente entre idiomas
- Conservar paridad de slugs entre ko / en / esGemini CLI vs Claude Code vs GPT Codex
| Aspecto | Claude Code | GPT Codex | Gemini CLI |
|---|---|---|---|
| Archivo principal | CLAUDE.md | AGENTS.md | GEMINI.md |
| Contexto | memoria conversacional fuerte | ejecución por tarea | memoria jerárquica + 1M tokens |
| Herramientas | local + MCP | orientado a sandbox | local + web + MCP + sub-agentes |
| Mejor uso | edición guiada | tareas de implementación acotadas | automatización y análisis masivo |
Qué leer después
- Análisis de repositorios: La ventaja de 1M tokens
- Delegar a expertos: Sub-agentes y Skills
- CI y scripts: Headless Automation