Publicado · 9 min de lectura
Cómo comprimir PDF sin perder calidad
Una guía práctica y sin rodeos para reducir el tamaño de los archivos PDF: qué es lo que realmente ocupa espacio, qué controles de compresión importan y cómo mantener el texto nítido y las firmas con valor legal.
Pulsas "Enviar", el correo rebota y la razón es siempre la misma: el PDF es demasiado grande. El límite del adjunto es de 25 MB, tu archivo pesa 38 MB y faltan diez minutos para la reunión. ¿Te suena? Casi todo el que trabaja con PDF ha vivido este momento, y casi todos recurren al primer enlace de "comprimir PDF online" que encuentran, rezan para que no estropee nada importante y lo envían.
Esta guía es la respuesta larga. Explica qué es lo que realmente hace grande a un PDF, qué hacen en realidad los distintos "niveles de compresión" que ves en las herramientas y cuándo es seguro usar cada uno. Al terminarla deberías poder mirar un PDF, predecir aproximadamente cuánto puede reducirse y elegir el enfoque adecuado sin jugar a la lotería.
Por qué los PDF acaban siendo tan grandes
Un PDF es esencialmente un contenedor. Dentro puedes encontrar flujos de texto, gráficos vectoriales, fuentes incrustadas, imágenes rasterizadas, campos de formulario, anotaciones, JavaScript, archivos adjuntos y metadatos. Cuando alguien se queja de que su PDF es enorme, el culpable casi nunca es el texto. El texto plano es asombrosamente pequeño: una novela entera se codifica en unos pocos cientos de kilobytes. El sobrepeso viene de tres lugares.
Primero, las imágenes rasterizadas incrustadas, especialmente los escaneos. Un único escaneo a página completa en color a 300 PPP equivale aproximadamente a 25 megapíxeles. Almacenado sin comprimir son alrededor de 75 MB; incluso con una compresión JPEG razonable puede seguir pesando entre 2 y 4 MB por página. Multiplica por un documento de 30 páginas y tienes un PDF de 100 MB. Segundo, las fuentes incrustadas. Una fuente OpenType moderna con cobertura Unicode completa puede pesar entre 1 y 3 MB por sí sola; una presentación que usa seis familias de fuentes engorda rápidamente. Tercero, objetos redundantes o nunca depurados: historial de revisiones, imágenes eliminadas que en realidad no se purgaron, copias duplicadas del mismo logotipo en cada página.
Saber cuál de estos predomina en tu archivo es el paso de diagnóstico más útil que existe. Un PDF lleno de escaneos y un PDF exportado desde diapositivas no son el mismo problema y no responden al mismo arreglo.
Las cuatro técnicas reales de compresión
Cuando un compresor de PDF anuncia "compresión inteligente" o "reducción con IA", casi siempre está haciendo alguna combinación de cuatro operaciones bien conocidas. Entenderlas te permite predecir el resultado en lugar de adivinar.
- Submuestreo de imágenes. Reducir las dimensiones en píxeles de las imágenes incrustadas. Un escaneo a 300 PPP remuestreado a 150 PPP recorta el número de píxeles 4 veces, lo que normalmente reduce el tamaño del archivo casi 4 veces. Es con pérdida en sentido estricto (no puedes recuperar los píxeles), pero a menudo invisible en pantalla.
- Recodificación de imágenes. Cambiar el códec o el ajuste de calidad: un mapa de bits sin comprimir a JPEG, o un JPEG de calidad 95 a calidad 75. Grandes ahorros, con una pérdida de calidad que va de imperceptible a evidente según lo agresivo que seas.
- Subconjunto y deduplicación de fuentes. Incrustar solo los glifos que el documento usa realmente y fusionar copias duplicadas de la misma fuente. Sin pérdidas. Un documento que incrusta tres fuentes completas puede recortar varios megabytes aquí sin cambiar un solo píxel.
- Compresión y limpieza de flujos de objetos. Eliminar objetos huérfanos, comprimir flujos internos con Flate (zlib), fusionar recursos idénticos. Totalmente sin pérdidas y prácticamente gratis en términos de riesgo.
Sin pérdidas vs. con pérdidas: elige la herramienta adecuada para el documento
La compresión es o sin pérdidas (cada byte que ahorras es recuperable, la salida visible es bit a bit idéntica) o con pérdidas (cambias algo de fidelidad por tamaño). El truco está en hacer coincidir la técnica con el cometido del documento.
Un contrato firmado, una presentación judicial, un archivo PDF/A notarizado, un artículo académico con figuras matemáticas: solo sin pérdidas. Una firma escaneada borrosa o una ecuación recodificada en JPEG pueden cambiar el significado legal o científico de un documento. Un folleto de marketing, una presentación de diapositivas para una reunión interna, una colección de recetas: con pérdidas está bien, a menudo es la única forma de alcanzar un objetivo de tamaño significativo.
Si no puedes saber con facilidad si un documento entra en la categoría de "nunca toques los píxeles", utiliza por defecto el modo sin pérdidas. Los ahorros son menores, pero no te puedes quemar.
Cómo lucen las cifras en el mundo real
Aquí tienes una guía aproximada de qué esperar, sacada de documentos de oficina típicos. Tómalas como orientación, no como promesa.
Document type Original After lossless After moderate lossy
--------------------------------------------------------------------------
Text-only report 10 MB 8 MB 7 MB
Mixed text + 5 photos 18 MB 15 MB 4 MB
Slide deck (PNG-heavy) 40 MB 32 MB 6 MB
Scanned 30-page PDF 50 MB 48 MB 5 MB
Ebook with cover art 12 MB 10 MB 3 MBPor qué los PDF solo de texto apenas se reducen
Si tu archivo es mayoritariamente texto y lo comprimes y apenas pasa nada, no lo estás haciendo mal. PDF ya comprime sus flujos de contenido con Flate por defecto. No hay mucho margen que exprimir. Las únicas victorias significativas para documentos solo de texto son el subconjunto de fuentes, eliminar metadatos no usados y quitar archivos incrustados olvidados. Expectativa realista: una reducción del 15 al 25 %, y punto. Cualquiera que prometa una compresión del 90 % en un PDF de texto puro o lo está rerasterizando (convirtiendo tu texto nítido en una imagen borrosa) o miente.
Esto importa porque cambia la forma en que deberías reaccionar. Si un escrito legal de 10 MB se niega a bajar de 8 MB, ese es el suelo. Dividirlo en dos PDF es un arreglo más honesto que destrozar el texto persiguiendo un número.
Por qué los PDF llenos de escaneos se reducen drásticamente
El reverso de la moneda: un documento escaneado de 50 MB puede caer rutinariamente a 5 MB sin pérdida visible de calidad para lectura en pantalla. ¿Por qué? Porque la mayoría de los escáneres usan por defecto 300 PPP en color, lo cual es excesivo para documentos que vas a leer en un monitor. 150 PPP basta y sobra para texto corrido en pantalla, y una calidad JPEG moderada es invisible al zoom normal. No estás destruyendo información tanto como eliminando información que tus ojos nunca van a usar.
Si el documento está pensado para imprimirse, mantén la línea entre 200 y 300 PPP. Si está pensado para enviarse por correo y leerse en un portátil, 150 PPP en escala de grises suele ser el punto óptimo. Si contiene escritura a mano diminuta o líneas de ingeniería finas, prueba primero una página antes de comprometerte con todo el lote.
Lo que NO hay que hacer
- No comprimas el mismo PDF dos veces con ajustes con pérdida. Cada pasada recodifica los JPEG y los artefactos se acumulan. Después de tres rondas, tu escaneo parece enviado por fax en 1994.
- No apliques compresión con pérdida a documentos legales firmados, contratos o cualquier cosa destinada a una presentación judicial. Incluso cambios sutiles de píxeles pueden anular el valor probatorio del documento, y una degradación visible de la firma queda sospechosa.
- No hagas OCR a un escaneo, lo comprimas con pérdida y luego vuelvas a hacer OCR. La segunda pasada de OCR sobre la imagen degradada producirá peor texto y habrás perdido el original.
- No subas PDF sensibles (historiales médicos, NDA, declaraciones de impuestos) a compresores web cualesquiera. Muchos guardan tu archivo en sus servidores; algunos se otorgan explícitamente derechos sobre él. Lee los términos o usa una herramienta que se ejecute localmente en tu navegador.
- No asumas que más pequeño siempre es mejor. Un PDF de 200 KB que nadie puede leer porque se descartó el texto OCR es peor que un PDF de 5 MB en el que las búsquedas funcionan correctamente.
Un árbol de decisión sencillo
Cuando tengas un PDF que reducir, recorre estas preguntas en orden. El noventa por ciento de las veces la respuesta sale en treinta segundos.
- ¿Es el documento legalmente sensible (firmado, notariado, presentación oficial)? Solo sin pérdidas. Detente aquí.
- ¿Es el archivo mayoritariamente texto sin imágenes grandes? Aplica una limpieza sin pérdidas; espera ahorros del 15 al 25 %; considera dividirlo si necesitas más.
- ¿Está el archivo dominado por escaneos o fotos y pensado para lectura en pantalla? Submuestrea a 150 PPP y recodifica con calidad JPEG moderada. Espera ahorros del 60 al 90 %.
- ¿Es el archivo una presentación de diapositivas o un PDF de marketing con capturas en PNG? Convierte los PNG a JPEG donde el contenido sea fotográfico; conserva PNG donde haya texto nítido o líneas finas.
- ¿El archivo está destinado a imprimirse? Mantén las imágenes a un mínimo de 200 a 300 PPP. Solo limpieza sin pérdidas.
Cómo se compara la compresión en el navegador
La mayoría de los compresores de PDF en línea suben tu archivo, lo procesan en un servidor y devuelven una versión más pequeña. Eso funciona, pero tiene dos costes: tu documento sale de tu máquina y esperas un viaje de ida y vuelta en cada cambio. Las herramientas basadas en navegador (incluida la /tools/pdf-compress de Multilities) hacen el trabajo localmente usando WebAssembly. Nada se sube, la respuesta es instantánea en archivos pequeños y puedes comprimir una carpeta de recibos en el tren sin gastar datos móviles.
La compresión en el navegador también tiene compromisos: los PDF muy grandes (unos cientos de megabytes) pueden estresar la memoria de un teléfono, y los pipelines de recodificación más pesados corren un poco más lentos que un servidor potente. Para el rango cotidiano de 5 a 50 MB que cubre la mayoría de los documentos del mundo real, el enfoque local es más rápido de extremo a extremo una vez que cuentas el tiempo de subida, y tus datos nunca salen del dispositivo.
Tácticas concretas que rinden por encima de su peso
Si quieres unas pocas victorias rápidas que funcionen en casi cualquier PDF, estos son los ajustes con mayor apalancamiento.
- Elimina las miniaturas incrustadas. Algunos generadores de PDF incrustan una miniatura de cada página dentro del archivo. Suman rápido en documentos largos y casi ningún visor moderno las necesita.
- Quita los campos de formulario y el JavaScript no usados. Las plantillas de formulario antiguas suelen arrastrar scripts inertes y definiciones de campos que nadie rellenó.
- Aplana anotaciones y comentarios. Si no necesitas seguir editándolos, aplanarlos los convierte en parte de la página y permite que la pasada de limpieza elimine los objetos subyacentes.
- Convierte los escaneos en color a escala de grises cuando el color no aporte información. Un escaneo en escala de grises a la misma resolución pesa aproximadamente un tercio que en color.
- Reexporta desde el origen. Si el archivo original es un documento de Word o una presentación de Keynote, exportar de cero con ajustes de "Tamaño mínimo" o "Calidad reducida" suele superar cualquier cosa que puedas hacerle a un PDF ya hinchado.
Qué significan en realidad los ajustes de un buen compresor
La mayoría de las herramientas exponen tres o cuatro niveles: Bajo, Medio, Alto, Extremo, o a veces nombres más amables como "Calidad de impresión", "Calidad de pantalla", "Listo para correo". Traducidos a las cuatro técnicas anteriores, suelen mapearse así. "Bajo" o "Impresión" ejecuta solo limpieza sin pérdidas y conserva las imágenes a 300 PPP. "Medio" o "Pantalla" submuestrea a unos 150 PPP y recodifica los JPEG a calidad 80. "Alto" o "Correo" empuja a 96-120 PPP y JPEG calidad 60. "Extremo" puede bajar a 72 PPP y calidad 40, donde el texto en los escaneos empieza a verse pastoso.
Si las etiquetas te confunden, ejecuta primero una página de prueba en el ajuste más alto y míralo con atención. Si la prueba se ve bien, normalmente puedes confiar en el mismo ajuste para el resto del documento.
Atando cabos
Comprimir bien un PDF consiste sobre todo en hacer coincidir la técnica con el documento. Un contrato firmado recibe limpieza sin pérdidas. Un informe escaneado de 50 MB recibe un submuestreo agresivo. Un artículo académico cargado de texto se acepta tal cual, porque ya no hay nada que exprimir. Las herramientas que mejor funcionan son las que te dejan elegir un nivel y te cuentan honestamente lo que hicieron.
La próxima vez que tu correo rebote, tómate diez segundos para preguntarte qué tipo de PDF tienes en realidad. Luego elige el ajuste correcto una vez, en lugar de pasarlo por cinco compresores distintos y acabar con una versión borrosa y con marca de agua de un documento que probablemente estaba bien tras una sola pasada cuidadosa. Si quieres una opción sin subida que se ejecute en el navegador y te muestre el tamaño antes/después antes de aceptar, la herramienta de compresión de PDF de Multilities está construida exactamente alrededor de este flujo. En cualquier caso, las ideas son las mismas: averigua qué hace grande a tu archivo, elige la herramienta más ligera que lo solucione y para cuando el trabajo esté hecho.