Pubblicato · 9 min di lettura
Come comprimere PDF senza perdita di qualità
Una guida pratica e senza fronzoli per ridurre la dimensione dei file PDF: cosa occupa davvero spazio, quali leve di compressione contano e come mantenere il testo nitido e le firme legali.
Premi "Invia", l'email rimbalza, e il motivo è sempre lo stesso: il PDF è troppo grande. Il limite per gli allegati è 25 MB, il tuo file è 38 MB e mancano dieci minuti all'inizio della riunione. Ti suona familiare? Quasi tutti coloro che lavorano con i PDF hanno vissuto questo momento, e quasi tutti cliccano sul primo link "comprimi PDF online" che riescono a trovare, pregano che non rovini nulla di importante e inviano.
Questa guida è la risposta più lunga. Spiega cosa rende davvero grande un PDF, cosa fanno realmente sotto il cofano i diversi "livelli di compressione" che vedi negli strumenti, e quando ciascuno è sicuro da usare. Alla fine dovresti essere in grado di guardare un PDF, prevedere all'incirca quanto può rimpicciolirsi e scegliere l'approccio giusto senza tirare a indovinare.
Perché i PDF diventano così grandi in primo luogo
Un PDF è essenzialmente un contenitore. Al suo interno puoi trovare flussi di testo, grafica vettoriale, font incorporati, immagini raster, campi modulo, annotazioni, JavaScript, file allegati e metadati. Quando le persone si lamentano che il loro PDF è enorme, il colpevole non è quasi mai il testo. Il testo semplice è incredibilmente piccolo: un intero romanzo si codifica in poche centinaia di kilobyte. Il gonfiore proviene da tre fonti.
Primo, le immagini raster incorporate, soprattutto le scansioni. Una singola scansione a colori a pagina intera a 300 DPI corrisponde a circa 25 megapixel. Memorizzata non compressa è circa 75 MB; anche con una ragionevole compressione JPEG può essere comunque 2-4 MB per pagina. Moltiplica per un documento di 30 pagine e ottieni un PDF da 100 MB. Secondo, i font incorporati. Un moderno font OpenType con copertura Unicode completa può essere 1-3 MB da solo; una presentazione che usa sei famiglie di font si gonfia rapidamente. Terzo, oggetti ridondanti o mai ripuliti: cronologia delle revisioni, immagini cancellate ma non effettivamente rimosse, copie duplicate dello stesso logo su ogni pagina.
Sapere quale di questi domina nel tuo file è il singolo passaggio diagnostico più utile. Un PDF pieno di scansioni e un PDF esportato da slide non sono lo stesso problema e non rispondono alla stessa soluzione.
Le quattro vere tecniche di compressione
Quando un compressore PDF pubblicizza "compressione intelligente" o "riduzione potenziata dall'AI", quasi sempre sta facendo una qualche combinazione di quattro operazioni ben note. Comprenderle ti permette di prevedere il risultato invece di indovinare.
- Sottocampionamento delle immagini. Riduzione delle dimensioni in pixel delle immagini incorporate. Una scansione a 300 DPI ricampionata a 150 DPI taglia il numero di pixel di 4 volte, il che di solito riduce la dimensione del file di circa 4 volte. Lossy in senso stretto (non puoi recuperare i pixel) ma spesso invisibile a schermo.
- Ricodifica delle immagini. Cambiare il codec o l'impostazione di qualità: da bitmap non compresso a JPEG, o da JPEG qualità 95 a JPEG qualità 75. Grandi guadagni, con perdita di qualità che varia da impercettibile a evidente a seconda di quanto sei aggressivo.
- Subset dei font e deduplicazione. Incorporare solo i glifi che il documento usa effettivamente e unire le copie duplicate dei font. Lossless. Un documento che incorpora tre font completi può perdere diversi megabyte qui senza cambiare un singolo pixel.
- Compressione dei flussi di oggetti e pulizia. Rimozione di oggetti orfani, compressione dei flussi interni con Flate (zlib), unione di risorse identiche. Completamente lossless e quasi gratuito in termini di rischio.
Lossless vs lossy: scegli lo strumento giusto per il documento
La compressione è o lossless (ogni byte risparmiato è recuperabile, l'output visibile è identico bit per bit) o lossy (scambi un po' di fedeltà per dimensione). Il trucco è abbinare la tecnica al lavoro del documento.
Un contratto firmato, un atto giudiziario, un archivio PDF/A notarile, un articolo accademico con figure matematiche: solo lossless. Una scansione di firma sfocata o un'equazione ri-JPEGgata può cambiare il significato legale o scientifico di un documento. Una brochure di marketing, una presentazione di slide per una riunione interna, una raccolta di ricette: lossy va bene, spesso è l'unico modo per raggiungere un obiettivo di dimensione significativo.
Se non riesci a capire facilmente se un documento appartiene alla categoria "non toccare mai i pixel", come impostazione predefinita usa il lossless. I risparmi sono minori ma non puoi rimanere scottato.
Come si presentano i numeri nel mondo reale
Ecco una guida approssimativa di cosa aspettarsi, tratta da tipici documenti d'ufficio. Trattali come orientamento, non come promesse.
Tipo documento Originale Dopo lossless Dopo lossy moderato
--------------------------------------------------------------------------
Report solo testo 10 MB 8 MB 7 MB
Misto testo + 5 foto 18 MB 15 MB 4 MB
Slide deck (PNG-heavy) 40 MB 32 MB 6 MB
PDF scansionato 30 pag. 50 MB 48 MB 5 MB
Ebook con copertina 12 MB 10 MB 3 MBPerché i PDF di solo testo si riducono a malapena
Se il tuo file è principalmente testo e lo comprimi e non succede quasi nulla, non stai sbagliando. Il PDF comprime già i suoi flussi di contenuto con Flate per impostazione predefinita. Non c'è molto margine da spremere. Le uniche vittorie significative per i documenti di solo testo sono il subset dei font, la rimozione dei metadati inutilizzati e la rimozione di file incorporati dimenticati. Aspettativa realistica: riduzione del 15-25%, punto. Chiunque prometta una compressione del 90% su un PDF di puro testo o lo sta ri-rasterizzando (trasformando il tuo testo nitido in un'immagine sfocata) o sta mentendo.
Questo conta perché cambia il modo in cui dovresti reagire. Se una memoria legale di 10 MB rifiuta di scendere sotto gli 8 MB, quello è il pavimento. Dividerla in due PDF è una soluzione più onesta che rovinare il testo per inseguire un numero.
Perché i PDF pieni di scansioni si riducono drasticamente
Il rovescio della medaglia: un documento scansionato di 50 MB può ridursi abitualmente a 5 MB senza alcuna perdita di qualità visibile per la lettura a schermo. Perché? Perché la maggior parte degli scanner imposta di default 300 DPI a colori, che è eccessivo per documenti che leggerai su un monitor. 150 DPI sono ampiamente sufficienti per il corpo del testo a schermo, e una qualità JPEG moderata è invisibile a uno zoom normale. Non stai distruggendo informazioni quanto stai rimuovendo informazioni che i tuoi occhi non useranno mai.
Se il documento è destinato alla stampa, mantieni 200-300 DPI. Se è destinato a essere inviato via email e letto su un laptop, 150 DPI in scala di grigi è solitamente il punto ottimale. Se contiene scrittura a mano minuta o linee tecniche fini, prova prima una pagina prima di impegnarti sull'intero lotto.
Cosa NON fare
- Non comprimere lo stesso PDF due volte con impostazioni lossy. Ogni passaggio ricodifica i JPEG, e gli artefatti si accumulano. Dopo tre giri la tua scansione sembra essere stata faxata nel 1994.
- Non eseguire compressione lossy su documenti legali firmati, contratti o qualsiasi cosa destinata a un atto giudiziario. Anche sottili cambiamenti di pixel possono invalidare il valore probatorio del documento, e una visibile degradazione della firma sembra sospetta.
- Non eseguire OCR su una scansione, poi comprimere in modo lossy, poi fare di nuovo OCR. Il secondo passaggio OCR sull'immagine degradata produrrà un testo peggiore e avrai perso l'originale.
- Non caricare PDF sensibili (cartelle cliniche, NDA, dichiarazioni dei redditi) su compressori web casuali. Molti conservano il tuo file sui loro server; alcuni si concedono esplicitamente diritti su di esso. Leggi i termini o usa uno strumento che funziona localmente nel tuo browser.
- Non dare per scontato che più piccolo sia sempre meglio. Un PDF da 200 KB che nessuno può leggere perché il testo OCR è stato buttato via è peggio di un PDF da 5 MB che si cerca correttamente.
Un semplice albero decisionale
Quando hai un PDF da ridurre, scorri queste domande nell'ordine. Il novanta percento delle volte la risposta arriva entro trenta secondi.
- Il documento è legalmente sensibile (firmato, notarile, atto ufficiale)? Solo lossless. Fermati qui.
- Il file è principalmente testo senza immagini grandi? Esegui una pulizia lossless; aspettati il 15-25% di risparmio; considera di dividere se ti serve di più.
- Il file è dominato da scansioni o foto e destinato alla lettura a schermo? Sottocampiona a 150 DPI e ricodifica con qualità JPEG moderata. Aspettati il 60-90% di risparmio.
- Il file è una presentazione di slide o un PDF di marketing con screenshot PNG? Converti i PNG in JPEG dove il contenuto è fotografico; mantieni PNG dove c'è testo nitido o line art.
- Il file è destinato alla stampa? Mantieni le immagini a un minimo di 200-300 DPI. Solo pulizia lossless.
Come si confronta la compressione basata su browser
La maggior parte dei compressori PDF online carica il tuo file, lo elabora su un server e ti rimanda indietro una versione più piccola. Funziona, ma ha due costi: il tuo documento lascia la tua macchina, e aspetti un round-trip a ogni cambiamento. Gli strumenti basati su browser (incluso /tools/pdf-compress di Multilities) fanno il lavoro localmente usando WebAssembly. Nulla viene caricato, la risposta è istantanea su file piccoli, e puoi comprimere una cartella di ricevute in treno senza consumare dati mobili.
Anche la compressione nel browser ha compromessi: PDF molto grandi (qualche centinaio di megabyte) possono mettere a dura prova la memoria di un telefono, e le pipeline di ricodifica più pesanti vanno un po' più lente di un server potente. Per la fascia quotidiana di 5-50 MB che copre la maggior parte dei documenti reali, l'approccio locale è più veloce end-to-end una volta contato il tempo di caricamento, e i tuoi dati non lasciano mai il dispositivo.
Tattiche specifiche che rendono più del previsto
Se vuoi alcune vittorie rapide che funzionano su quasi qualsiasi PDF, queste sono le modifiche con la massima leva.
- Rimuovi le miniature incorporate. Alcuni generatori PDF inseriscono una miniatura di ogni pagina nel file. Si sommano rapidamente su documenti lunghi e quasi nessun visualizzatore moderno ne ha bisogno.
- Rimuovi i campi modulo inutilizzati e JavaScript. I vecchi modelli di modulo spesso portano script inerti e definizioni per campi che nessuno ha compilato.
- Appiattisci annotazioni e commenti. Se non hai bisogno di continuare a modificarli, l'appiattimento li trasforma in parte della pagina e permette al passaggio di pulizia di rimuovere gli oggetti sottostanti.
- Converti le scansioni a colori in scala di grigi quando il colore non è informativo. Una scansione in scala di grigi alla stessa risoluzione DPI è circa un terzo della dimensione di quella a colori.
- Riesporta dalla sorgente. Se il file originale è un documento Word o una presentazione Keynote, esportare di nuovo con impostazioni "Dimensione minima" o "Qualità ridotta" spesso batte tutto ciò che puoi fare a un PDF già gonfiato.
Cosa significano davvero le impostazioni di un buon compressore
La maggior parte degli strumenti espone tre o quattro livelli: Basso, Medio, Alto, Estremo, o talvolta nomi più amichevoli come "Qualità stampa", "Qualità schermo", "Pronto per email". Tradotti nelle quattro tecniche sopra, di solito si mappano così. "Basso" o "Stampa" esegue solo la pulizia lossless e preserva le immagini a 300 DPI. "Medio" o "Schermo" sottocampiona a circa 150 DPI e ricodifica i JPEG a qualità 80. "Alto" o "Email" spinge a 96-120 DPI e qualità JPEG 60. "Estremo" può scendere a 72 DPI e qualità 40, dove il testo nelle scansioni inizia a sembrare poltiglia.
Se trovi confuse le etichette, prova prima una pagina di prova all'impostazione più alta e guardala con attenzione. Se la prova sembra a posto, di solito puoi fidarti della stessa impostazione per il resto del documento.
Mettendo tutto insieme
Comprimere bene un PDF riguarda principalmente l'abbinamento della tecnica al documento. Un contratto firmato riceve una pulizia lossless. Un report scansionato di 50 MB riceve un sottocampionamento aggressivo. Un articolo accademico ricco di testo viene accettato com'è, perché non c'è più nulla da spremere. Gli strumenti che funzionano meglio sono quelli che ti permettono di scegliere un livello e ti dicono onestamente cosa hanno fatto.
La prossima volta che la tua email rimbalza, prenditi dieci secondi per chiederti che tipo di PDF hai effettivamente. Poi scegli l'impostazione giusta una volta, invece di passarlo per cinque compressori diversi e finire con una versione sfocata e filigranata di un documento che probabilmente andava bene dopo un singolo passaggio attento. Se vuoi un'opzione senza upload che funzioni nel browser e ti mostri la dimensione prima/dopo prima di confermare, lo strumento di compressione PDF di Multilities è costruito esattamente attorno a questo flusso di lavoro. In ogni caso, le idee sono le stesse: sappi cosa rende grande il tuo file, scegli lo strumento più leggero che lo risolve e fermati quando il lavoro è fatto.