NVIDIA y OpenAI lanzan gpt-oss: IA local ultra rápida con GPUs RTX

por ytools August 6, 2025

August 6, 2025 1 comentario 4 vistas

Lo más importante ▼

NVIDIA y OpenAI acaban de lanzar la nueva familia de modelos gpt-oss, diseñada para funcionar directamente en PCs con GPUs RTX.
NVIDIA y OpenAI lanzan gpt-oss: IA local ultra rápida con GPUs RTX
Sí, ahora puedes correr IA de altísimo nivel en tu propia máquina, sin depender de la nube ni de servidores externos.

Hay dos versiones disponibles: gpt-oss-20b, que corre como un rayo en PCs RTX con mínimo 16 GB de VRAM, y gpt-oss-120b, pensada para estaciones de trabajo con GPUs RTX PRO. El modelo 20b puede generar hasta 250 tokens por segundo en una RTX 5090 – más rápido de lo que puedes leer.

Ambos modelos fueron entrenados en GPUs H100 de NVIDIA y aprovechan la nueva precisión MXFP4, que mejora la calidad sin afectar el rendimiento. Además, soportan contextos de hasta 131.072 tokens, ideal para tareas complejas de lenguaje.

Todo está basado en arquitectura Mixture of Experts (MoE), que permite razonamiento paso a paso, ejecución de instrucciones y uso de herramientas externas.

¿Quieres probarlos ya? Aquí van las opciones:

Ollama App: interfaz súper fácil, lista para usar con RTX.
Llama.cpp: NVIDIA colabora con la comunidad open source para mejorar el rendimiento con CUDA Graphs.
Microsoft AI Foundry: en Windows solo hace falta un comando en terminal para lanzar el modelo.

Jensen Huang, CEO de NVIDIA, lo resumió así: “gpt-oss permite a los desarrolladores crear con IA avanzada directamente desde sus dispositivos, usando la infraestructura de cómputo más grande del mundo”.

Algunos critican que las RTX 5000 siguen con 5nm en pleno 2025, pero cuando ves lo que puede hacer gpt-oss de forma local, esas quejas se sienten vacías. Esto es IA sin límites.

Podrías estar interesado en

Fuente: https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss https://openai.com/index/introducing-gpt-oss/ https://www.nvidia.com/en-us/data-center/h100/ https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss https://ollama.com/blog/new-app https://github.com/ggml-org/llama.cpp https://azure.microsoft.com/en-us/products/ai-foundry

artículo anterior

PS6 vs Xbox Next: filtraciones comparan las consolas con RX 9070XT y RTX 5080

próximo artículo

Figma se desinfla, Palantir toma impulso: Jim Cramer agita el avispero

1 comentario

ZedTechie January 6, 2026 - 5:50 am

No más suscripciones ni APIs carísimas, ahora todo local 🧠

Responder

Deja un comentario Cancelar respuesta

8Elite
Ya tocaba cambiar la cara pública de la IA de Intel, la comunicación era flojita y no inspiraba mucha confianza,…
XiaoMao
quiero ver si ese 50% más fuerte es real o puro marketing
zoom-zoom
suerte presi, a ver si tiktok aguanta esto 🔥
Rooter
mueven algo de sitio y ya es 'innovación' 😏
SunnySide
Está brutal ese diseño, parece de otro planeta 😍
Baka
Probé la versión gratuita después de que se me acabó la suscripción Plus, y fue un desastre. ¡No pude soportarlo…
ZshZen
El precio es el jefe final. Si quieren gamers, hay que bajar el peaje ‘Pro’
Markus
Quiero duelo de bar: 18 Pro vs 17 Pro de noche y sin filtros 😂
oleg
Que lideren en next-gen + PC, las CPUs de las consolas actuales ya van justitas
ZloyHater
AI en audífonos? suena loco pero curioso

NVIDIA y OpenAI lanzan gpt-oss: IA local ultra rápida con GPUs RTX

PS6 vs Xbox Next: filtraciones comparan las consolas con RX 9070XT y RTX 5080

Figma se desinfla, Palantir toma impulso: Jim Cramer agita el avispero

También te puede interesar

1 comentario

Deja un comentario Cancelar respuesta