Bloga dön

Yayın tarihi · 7 dk okuma

PDF Kalitesini Kaybetmeden Nasıl Sıkıştırılır

PDF dosyalarını küçültmek için pratik bir rehber: dosyayı asıl şişiren ne, hangi sıkıştırma ayarı ne işe yarıyor ve metni, imzayı, hukuki belgeyi nasıl bozmadan boyut düşürürsünüz.

"Gönder"e basıyorsunuz, mail geri dönüyor; sebep her seferinde aynı: PDF çok büyük. Ek limiti 25 MB, dosyanız 38 MB, toplantıya on dakika var. Tanıdık geldi mi? PDF ile çalışan hemen herkesin başına gelir ve hemen herkes ilk bulduğu "PDF sıkıştırma online" sitesine girer, dua eder ve dosyayı atar.

Bu yazı o tek tıklık çözümün uzun cevabı. Bir PDF'i asıl şişiren şeyin ne olduğunu, araçların gösterdiği "sıkıştırma seviyesi" seçeneklerinin perde arkasında ne yaptığını ve hangisini güvenle kullanabileceğinizi anlatıyor. Yazıyı bitirdiğinizde elinizdeki bir PDF'e bakıp ne kadar küçülebileceğini kabaca tahmin edebilir, doğru yaklaşımı şansa bırakmadan seçebilirsiniz.

PDF'ler neden bu kadar büyür?

PDF aslında bir kap. İçinde metin akışları, vektör çizimler, gömülü yazı tipleri, raster görseller, form alanları, açıklamalar, JavaScript, ekli dosyalar ve metaveri bulunabilir. İnsanlar PDF'lerinin devasa olduğundan şikayet ederken suçlu neredeyse hiçbir zaman metin değildir. Düz metin şaşırtıcı derecede küçüktür: bir roman bile birkaç yüz kilobayta sığar. Asıl şişme üç yerden gelir.

Birincisi, gömülü raster görseller, özellikle taramalar. 300 DPI renkli bir tam sayfa tarama yaklaşık 25 megapikseldir. Sıkıştırılmadan saklanırsa 75 MB civarı; makul JPEG sıkıştırmasıyla bile sayfa başına 2-4 MB olabilir. Bunu 30 sayfa ile çarpın, 100 MB'lik bir PDF elinizde. İkincisi, gömülü fontlar. Tam Unicode kapsamlı modern bir OpenType fontu tek başına 1-3 MB tutabilir; altı font ailesi kullanan bir sunum hızla şişer. Üçüncüsü, hiç temizlenmemiş artık nesneler: düzenleme geçmişi, silinmiş ama gerçekten kaldırılmamış görseller, her sayfada tekrar tekrar gömülmüş aynı logo.

Hangisinin sizin dosyanıza hakim olduğunu bilmek en kıymetli teşhis adımıdır. Tarama ağırlıklı bir PDF ile sunumdan dışa aktarılmış bir PDF aynı problem değildir ve aynı çözüm onları kurtarmaz.

Dört temel sıkıştırma tekniği

Bir PDF sıkıştırıcı "akıllı sıkıştırma" veya "yapay zeka destekli küçültme" diye reklam yaptığında, perdenin arkasında yaptığı şey neredeyse her zaman dört bilinen işlemin bir kombinasyonudur. Bunları anlamak, sonucu tahmin etmenizi sağlar.

  • Görsel örnekleme düşürme (down-sampling). Gömülü görsellerin piksel boyutlarını küçültmek. 300 DPI bir taramayı 150 DPI'a düşürmek piksel sayısını 4 kat azaltır, bu da çoğunlukla dosya boyutunu 4 kata yakın küçültür. Teknik olarak kayıplı (pikselleri geri alamazsınız) ama ekranda çoğu zaman fark edilmez.
  • Görsel yeniden kodlama. Kodek ya da kalite ayarını değiştirmek: sıkıştırılmamış bitmap'i JPEG'e çevirmek ya da JPEG kalite 95'i JPEG kalite 75'e indirmek. Büyük kazanç, ne kadar agresif gittiğinize göre kalite kaybı fark edilmezden bariza kadar değişir.
  • Font alt kümeleme ve tekilleştirme. Belgenin gerçekten kullandığı glifleri gömmek ve mükerrer font kopyalarını birleştirmek. Tamamen kayıpsız. Üç tam font gömen bir belge tek bir piksel değişmeden burada birkaç megabayt düşürebilir.
  • Nesne akışı sıkıştırma ve temizlik. Yetim nesneleri silmek, içerideki akışları Flate (zlib) ile sıkıştırmak, aynı kaynakları birleştirmek. Tamamen kayıpsız ve risk açısından neredeyse bedava.

Kayıpsız mı kayıplı mı? Belgeye göre seçin

Sıkıştırma ya kayıpsızdır (kazandığınız her bayt geri alınabilir, görünen çıktı bayt bayt aynıdır) ya da kayıplıdır (bir miktar kaliteyi boyutla takas edersiniz). İşin sırrı, tekniği belgenin görevine eşlemekte.

İmzalı bir sözleşme, mahkeme dosyası, noter onaylı PDF/A arşivi ya da matematik formülleri içeren akademik makale: sadece kayıpsız. Bulanıklaşmış bir imza taraması ya da yeniden JPEG'lenmiş bir denklem belgenin hukuki veya bilimsel anlamını değiştirebilir. Pazarlama broşürü, ekip içi sunum, yemek tarifi koleksiyonu: kayıplı gayet uygun, çoğu zaman anlamlı bir boyut hedefini tutturmanın tek yolu.

Belgenin "piksellere dokunma" kategorisinde olup olmadığını kolayca söyleyemiyorsanız, varsayılanınız kayıpsız olsun. Kazanç daha küçüktür ama başınız yanmaz.

Gerçek dünyada rakamlar nasıl?

Tipik ofis belgelerinde ne beklemeniz gerektiğine dair kaba bir kılavuz aşağıda. Söz değil, yön tabelası olarak kullanın.

Belge türü                Orijinal   Kayıpsız sonra   Orta kayıplı sonra
----------------------------------------------------------------------------
Sadece metin rapor        10 MB      8 MB             7 MB
Metin + 5 fotoğraf        18 MB      15 MB            4 MB
Sunum (PNG ağırlıklı)     40 MB      32 MB            6 MB
30 sayfalık tarama        50 MB      48 MB            5 MB
Kapaklı e-kitap           12 MB      10 MB            3 MB

Sadece metin PDF'leri neden zar zor küçülür?

Dosyanız çoğunlukla metinse ve sıkıştırdığınızda neredeyse hiçbir şey olmuyorsa, yanlış yapmıyorsunuz. PDF zaten içerik akışlarını varsayılan olarak Flate ile sıkıştırıyor. Sıkacak fazla yer yok. Sadece metinli belgelerde anlamlı kazançlar font alt kümeleme, kullanılmayan metaverinin temizlenmesi ve unutulmuş gömülü dosyaların atılmasından gelir. Gerçekçi beklenti: yüzde 15-25 küçülme, hepsi bu. Saf metin bir PDF'te yüzde 90 sıkıştırma vaat eden ya yeniden rasterleştirme yapıyor (net metni bulanık görsele çeviriyor) ya da yalan söylüyor.

Bu önemli, çünkü tepkinizi değiştiriyor. 10 MB'lık bir hukuki dilekçe 8 MB'ın altına inmiyorsa, taban orası. Onu ikiye bölmek, bir sayının peşinden metni bozmaktan çok daha dürüst bir çözümdür.

Tarama ağırlıklı PDF'ler neden bir anda küçülür?

Madalyonun öteki yüzü: 50 MB'lık taranmış bir belge, ekrandan okumak için görünür kalite kaybı yaşamadan rahatlıkla 5 MB'a inebilir. Neden? Çünkü çoğu tarayıcı varsayılan olarak 300 DPI renkli tarar ve bu, monitörden okuyacağınız belgeler için fazlasıyla abartı. Ekrandaki gövde metni için 150 DPI ziyadesiyle yeter, orta kalitede JPEG normal yakınlaştırmada görünmez. Bilgi yok etmiyorsunuz; gözlerinizin zaten kullanmayacağı bilgiyi atıyorsunuz.

Belge basılacaksa 200-300 DPI'da kalın. E-postayla gönderilip dizüstünden okunacaksa, gri tonlama 150 DPI çoğu zaman tam yerinde. Küçücük el yazısı veya ince mühendislik çizgileri içeriyorsa, tüm belgeyi sıkmadan önce tek sayfayı deneyip sonucu inceleyin.

YAPMAMANIZ gerekenler

  • Aynı PDF'i kayıplı ayarlarla iki kez sıkıştırmayın. Her geçişte JPEG'ler yeniden kodlanır ve bozulmalar üst üste binerek artar. Üç turdan sonra taramanız 1994'te fakslanmış gibi görünür.
  • İmzalı hukuki belgeler, sözleşmeler veya mahkemeye sunulacak hiçbir şey üzerinde kayıplı sıkıştırma çalıştırmayın. Çok küçük piksel değişiklikleri bile belgenin delil değerini sarsabilir, bozulmuş bir imza ister istemez şüphe çeker.
  • Bir taramayı OCR'layıp sonra kayıplı sıkıştırıp sonra tekrar OCR yapmayın. İkinci OCR turu bozulmuş görsel üzerinden çalışır, daha kötü metin üretir ve orijinali geri alamazsınız.
  • Hassas PDF'leri (sağlık raporu, gizlilik sözleşmesi, vergi beyannamesi) rastgele web sıkıştırıcılarına yüklemeyin. Çoğu dosyanızı sunucularında tutar; bazıları kullanım haklarını açıkça kendine devreder. Şartları okuyun ya da tarayıcıda yerel çalışan bir araç tercih edin.
  • Daha küçüğün her zaman daha iyi olduğunu varsaymayın. OCR metni atılmış 200 KB'lık, kimsenin arayamadığı bir PDF; doğru aranan 5 MB'lık bir PDF'ten kötüdür.

Basit bir karar ağacı

Küçültmeniz gereken bir PDF olduğunda şu soruları sırayla geçin. Çoğu zaman cevap otuz saniye içinde gelir.

  • Belge hukuki açıdan hassas mı (imzalı, noter onaylı, resmi başvuru)? Sadece kayıpsız. Burada durun.
  • Dosya çoğunlukla metin, büyük görsel yok mu? Kayıpsız temizlik çalıştırın; yüzde 15-25 kazanç bekleyin; daha fazlası lazımsa bölmeyi düşünün.
  • Dosyaya tarama veya fotoğraflar mı hakim ve ekrandan mı okunacak? 150 DPI'a indirip orta JPEG kalitesinde yeniden kodlayın. Yüzde 60-90 kazanç bekleyin.
  • Dosya PNG ekran görüntülü bir sunum ya da pazarlama PDF'i mi? Fotografik içerikteki PNG'leri JPEG'e çevirin; keskin metin veya çizgi olan yerlerde PNG kalsın.
  • Dosya baskıya mı gidecek? Görselleri en az 200-300 DPI'da bırakın. Sadece kayıpsız temizlik.

Tarayıcıda sıkıştırma nereye oturuyor?

Çoğu çevrimiçi PDF sıkıştırıcı dosyanızı yükler, bir sunucuda işler ve küçük halini geri yollar. Çalışıyor, ama iki bedeli var: belge makinenizden çıkıyor ve her değişiklikte gidiş-dönüş bekliyorsunuz. Tarayıcıda çalışan araçlar (Multilities'in /tools/pdf-compress sayfası dahil) işi WebAssembly ile yerel yapar. Hiçbir şey yüklenmez, küçük dosyalarda yanıt anında gelir ve mobil veriyi yakmadan trende fiş klasörü sıkıştırabilirsiniz.

Tarayıcıda sıkıştırmanın takasları da var: çok büyük PDF'ler (birkaç yüz megabayt) telefonun belleğini zorlayabilir, en ağır yeniden kodlama hatları güçlü bir sunucudan biraz daha yavaş çalışır. Gerçek dünyadaki belgelerin çoğunu kapsayan 5-50 MB aralığında ise yükleme süresini de hesaba kattığınızda yerel yaklaşım uçtan uca daha hızlıdır ve veriniz cihazınızdan hiç çıkmaz.

Boyutuna göre çok iş gören püf noktaları

Hemen hemen her PDF'te işe yarayan birkaç hızlı kazanç istiyorsanız, en yüksek getirili ayarlar bunlar.

  • Gömülü küçük resimleri (thumbnail) atın. Bazı PDF üreticileri her sayfanın küçük bir önizlemesini dosyaya yapıştırır. Uzun belgelerde hızla birikir ve modern görüntüleyiciler bunlara ihtiyaç duymaz.
  • Kullanılmayan form alanlarını ve JavaScript'i kaldırın. Eski form şablonları, kimsenin doldurmadığı alanlar için atıl betikler taşır.
  • Açıklama ve yorumları düzleştirin. Üzerinde düzenleme yapmaya devam etmeyecekseniz, düzleştirmek onları sayfanın bir parçası yapar; temizlik adımı altta yatan nesneleri kaldırabilir.
  • Renk bilgi taşımıyorsa renkli taramaları gri tonlamaya çevirin. Aynı DPI'daki gri tonlamalı bir tarama, renklinin yaklaşık üçte biri kadardır.
  • Mümkünse kaynaktan yeniden dışa aktarın. Orijinal Word ya da Keynote ise, "En küçük boyut" veya "Düşük kalite" ile yeniden export almak, zaten şişmiş bir PDF üzerinde yapacağınız her şeyden iyi sonuç verir.

Sıkıştırıcı seviyeleri aslında ne anlama geliyor?

Çoğu araç üç-dört seviye sunar: Düşük, Orta, Yüksek, Aşırı; bazen "Baskı kalitesi", "Ekran kalitesi", "E-postaya hazır" gibi daha samimi adlarla. Yukarıdaki dört tekniğe çevirdiğimizde genelde şöyle eşleşirler. "Düşük" ya da "Baskı" sadece kayıpsız temizlik yapar ve görselleri 300 DPI'da tutar. "Orta" ya da "Ekran" 150 DPI civarına düşürür ve JPEG'leri kalite 80'de yeniden kodlar. "Yüksek" ya da "E-posta" 96-120 DPI ve JPEG kalite 60'a iner. "Aşırı" 72 DPI ve kalite 40'a kadar düşebilir; bu noktada taramalardaki metin yumuşamaya başlar.

Etiketler kafa karıştırıyorsa, önce en yüksek seviyede tek bir deneme sayfası oluşturup dikkatlice bakın. Deneme iyi görünüyorsa belgenin geri kalanına aynı ayarı güvenle uygulayabilirsiniz.

Hepsini bir araya getirmek

PDF'i iyi sıkıştırmanın özü, tekniği belgeye eşlemekten ibaret. İmzalı sözleşmeye kayıpsız temizlik. 50 MB taranmış rapora agresif örnekleme düşürme. Metin ağırlıklı akademik makaleyi olduğu gibi kabul edersiniz, çünkü sıkacak yer kalmamıştır. En iyi araçlar, bir seviye seçmenize izin veren ve ne yaptığını dürüstçe söyleyenlerdir.

Bir dahaki sefere mailiniz geri döndüğünde on saniyenizi ayırıp elinizdeki PDF'in gerçekten ne tür bir PDF olduğunu sorun. Sonra doğru ayarı bir kez seçin; beş farklı sıkıştırıcıdan geçirip ilk denemede zaten yeterince iyi olan bir belgenin bulanık ve filigranlı bir kopyasıyla kalmaktansa. Tarayıcıda çalışan, dosyayı yüklemeyen ve onaylamadan önce öncesi/sonrası boyutu gösteren bir seçenek istiyorsanız, Multilities'in PDF sıkıştırma aracı tam olarak bu akış etrafında kurulmuş. Hangi yolu seçerseniz seçin, mantık aynı: dosyayı asıl şişiren şeyi bilin, onu çözen en hafif aracı seçin ve iş bittiğinde durun.

Bu araçları dene