Primeros pasos con Gemini CLI

Referencias oficiales: Resumen general · Instalación · Autenticación · GEMINI.md

Por qué Gemini CLI merece una guía aparte

Gemini CLI es el agente de terminal de código abierto de Google. Hoy su propuesta es bastante clara: juntar modelos Gemini, herramientas locales, acceso web y memoria de proyecto en una sola CLI que funciona bien tanto en sesiones interactivas como en automatización.

En un repositorio como este, Gemini CLI destaca especialmente en tres casos:

Entender repositorios grandes — la ventana de 1M tokens ayuda a hacer lecturas amplias.
Combinar archivos locales y web — puede leer archivos, ejecutar shell y traer información actual.
Reutilizar instrucciones — GEMINI.md evita repetir el mismo contexto en cada prompt.

Instálalo de la forma práctica

La documentación oficial recomienda Node.js 20+.

# instalación global con npm
npm install -g @google/gemini-cli
 
# macOS / Linux
brew install gemini-cli
 
# probar sin instalación permanente
npx @google/gemini-cli

Elige bien la autenticación

La guía oficial separa claramente varios escenarios:

Situación	Mejor opción	Nota
Uso personal en local	Iniciar sesión con Google	Flujo más simple
Scripts / CI / headless	API key de Gemini	Configuración fácil con variables de entorno
Organización centrada en GCP	Vertex AI	Encaja con controles de Google Cloud
Cuenta de empresa / escuela	Login con Google + proyecto	A menudo requiere proyecto de Cloud

1) Iniciar sesión con Google

gemini

Luego elige el flujo de login de Google.

2) Usar una API key de Gemini

Ideal para scripts, jobs headless o configuraciones mínimas:

export GEMINI_API_KEY="YOUR_GEMINI_API_KEY"
gemini

3) Usar Vertex AI

Útil cuando el equipo ya trabaja con modelos desde Google Cloud:

export GOOGLE_CLOUD_PROJECT="your-project-id"
export GOOGLE_CLOUD_LOCATION="us-central1"
gemini

Primeros comandos y Flujos de trabajo base

Gemini CLI mejora mucho cuando usas su sintaxis de herramientas en lugar de depender solo de prompts largos.

Interacción básica

# Iniciar modo interactivo
gemini
 
# Incluir archivos o directorios con @
gemini "@package.json @src explica la arquitectura de la app"
 
# Ejecutar shell con ! (El agente lee y analiza el resultado)
!npm test

Flujo de trabajo central: Investigación -> Estrategia -> Ejecución

No te limites a chatear; guía al agente por fases:

Investigación (Research): Pide al agente que explore (grep_search, glob) para mapear el código.
Estrategia (Strategy): Pide un diseño y plan antes de que modifique nada.
Ejecución (Execution): Permite que aplique cambios precisos (replace, write_file) y valide.

Aprovechando el Plan Mode (`/plan`)

Para refactorizaciones o decisiones grandes, es riesgoso dejar que edite de inmediato. Usa el comando /plan para entrar en Plan Mode. En este modo de solo lectura, el agente no puede modificar archivos ni ejecutar comandos destructivos. Se enfoca en analizar y redactar un plan sólido. Una vez aprobado, vuelve al modo predeterminado para ejecutar de manera segura.

`GEMINI.md` es donde de verdad se vuelve potente

Gemini CLI carga GEMINI.md de forma jerárquica:

~/.gemini/GEMINI.md (preferencias globales)
archivos del workspace (reglas del proyecto)
contexto JIT en subdirectorios

Ejemplo de archivo

# Project: AI Native Notes
 
## Stack
- Next.js 16
- TypeScript
- next-intl
- contenido MDX en /content
 
## Content rules
- Mantener frontmatter consistente entre idiomas
- Conservar paridad de slugs entre ko / en / es

Gemini CLI vs Claude Code vs GPT Codex

Aspecto	Claude Code	GPT Codex	Gemini CLI
Archivo principal	CLAUDE.md	AGENTS.md	GEMINI.md
Contexto	memoria conversacional fuerte	ejecución por tarea	memoria jerárquica + 1M tokens
Herramientas	local + MCP	orientado a sandbox	local + web + MCP + sub-agentes
Mejor uso	edición guiada	tareas de implementación acotadas	automatización y análisis masivo

Qué leer después

Análisis de repositorios: La ventaja de 1M tokens
Delegar a expertos: Sub-agentes y Skills
CI y scripts: Headless Automation

Guías Conectadas