公開日 · 読了時間 1 分
ブラウザでのファイル処理がアップロードに勝る理由
ほとんどのオンラインPDF・画像ツールは、あなたが何の関係も持たないサーバーに静かにファイルを送信しています。ブラウザで動くクライアントサイド処理はそのモデルを反転させます: ファイルはタブを離れません。アップロードをやめると何が変わるのかを解説します。
この10年でほぼ誰もが身につけた小さな習慣があります。2つのPDFを結合したい、画像を縮小したい、スマホが作ったHEIC写真を同僚が実際に開ける形式に変換したい。検索し、最初の結果をクリックし、ファイルをブラウザにドラッグして待つ。プログレスバーが進む。ダウンロードリンクが現れる。あなたは1日を進めます。
無料に感じます。無害に感じます。多くの場合、本当に無害です。しかしこのパターンは、あなたが本当に同意していない静かな取引を隠しています: あなたの文書のコピーが、今や誰かのサーバーに住んでいる、ということです。1時間。1日。会社自体が存在する期間より長く。
本記事は、この数年で本当に実用的になった別のモデル — Multilitiesがその上に作られているモデル — について、そして次に見つける「無料オンラインツール」に請求書、契約書、家族写真を貼り付ける前に考えるべきトレードオフについて書きます。
「アップロードして変換」が本当に意味するもの
古典的なオンラインユーティリティは、外から見るとクライアントサイドのツールと同じに見えます。ドロップゾーンがあり、ボタンがあり、結果があります。内部では非常に異なることをしており、その違いはマーケティングページが認める以上に重要です。
アップロードすると、マウスを離した瞬間にファイルはあなたの端末を離れます。TLS越しにあなたが所有しないサーバーへ移動し、ディスクに書かれ、処理され、出力として再びディスクに書かれ、CDN経由で返されます。いずれの段階も単独では悪意がありませんが、積み重なると、あなたが検査できない管理連鎖を形成します。
- ワーカーキューがピックアップする間、あなたの生ファイルが取り込みバケットに置かれる。
- 処理済み出力が、CDNがオンデマンドで配信できるように送信バケットに置かれる。
- 両ファイルは通常、別リージョンのバックアップストレージにレプリケートされる。
- アクセスログがファイル名、サイズ、IP、ユーザーエージェント、時刻を記録し、しばしば数か月保持される。
- サービスがOCR、AI要約、「スマート」機能を提供している場合、ファイル内容は別データセンターの別モデルによって読まれる。
- CDNエッジでキャッシュされたものは、UIで表示される「ファイルを削除しました」のメッセージの後も残ることがある。
「24時間で削除」の約束は多くを担っている
ほとんどのアップロード型PDF・画像ツールは「ファイルは1時間以内に削除されます」「24時間以内に削除されます」のような何かを宣伝します。注意深く読んでください。彼らがほぼ常に意味するのはプライマリのオブジェクトストアです。バックアップ、スナップショット、ログ行、派生サムネイル、アナリティクスイベントは、エンドユーザーにめったに表示されない別の保持スケジュールに従います。
すべての約束が文字通り守られたとしても、あなたは話したことのない会社に、見知らぬ人に手渡したくない文書を預けています。家でシュレッダーにかけるパスポートのスキャンが、その1時間、何千人もの他人のパスポートの隣のキューに座っているのです。
実際の数字: あなたのファイルが本当に行く先
平均的なアップロード型PDFツールのデータ経路:
あなたのファイル
-> HTTPS で彼らのロードバランサーへアップロード
-> 取り込みバケット (オブジェクトストレージ、レプリケーション)
-> ワーカーポッドがディスクからファイルを読む
-> 処理済み出力が送信バケットに書き込まれる
-> CDN エッジが結果をダウンロード用にキャッシュ
-> アクセスログ (ファイル名, IP, UA) を 30-180 日保持
-> バックアップを 7-90 日保持
-> 最終的に削除 (ほぼ)
ブラウザベースのツールのデータ経路:
あなたのファイル
-> タブ内に留まる
-> WebAssembly / Canvas / pdf-lib によりメモリ内で処理
-> 結果が Blob としてあなたに渡される
-> 何もデバイスを離れない脅威モデルは「ハッカー」だけではない
「プライバシー」と聞くと、人々はフード姿の攻撃者がデータベースを侵害する場面を思い浮かべることがよくあります。それは起こりますし、ファイル変換サービスからの侵害開示も珍しくありません。しかし、計画すべきは、より平凡なリスクのほうです。
第三者にアップロードしたファイルは召喚状を受けることがあります。インシデント対応中に従業員に読まれることがあります。創業者がまだ作っていない将来のアナリティクスパイプラインに投入されることがあります。誰も話していないモデルの学習に使われることがあります。価値観の異なる買い手に会社ごと買収されることがあります。誰かが悪人である必要はなく、時間が経つだけで起こります。
変わったこと: ブラウザが本当に良くなった
本記事が2026年に存在できる理由は、ブラウザがもう薄いドキュメントビューアではないからです。最新のブラウザは小さく速いオペレーティングシステムを出荷します。WebAssemblyはネイティブに近いコードを動かします。Canvas APIはネットワークに触れずに画像をラスタライズ、変形、再エンコードできます。pdf-libのようなライブラリは、JavaScriptだけでPDFをパース、編集、出力します。File System Access APIはユーザー許可のもと、タブが直接ファイルを読み書きできるようにします。
これらを組み合わせれば、典型的なPDF結合、画像圧縮、EXIF除去、ハッシュ計算、QR生成は完全にあなたのマシン上で、ウェブサイトを残りのシステムから隔離する同じサンドボックス内で行えます。
クライアントサイドツール使用時に保存されるもの
- ページのレンダリングと実行に必要な静的HTML、CSS、JavaScript、WebAssembly。
- プライバシー尊重型のアナリティクスを使っていれば、匿名で集約されたトラフィックカウント。
- あなたが最後に自分のディスクに保存することを選んだもの。
保存されないもの
- あなたのファイル。入力もなければ、出力もなく、サムネイルもなければ、バイトのハッシュもありません。
- あなたのファイル名、ページ数、画像寸法、文書メタデータ。
- 文書内のテキスト、画像、署名。
- あなたが行った特定の操作とあなたのIPを結びつけるログ。
初回ロード後のオフラインはギミックではない
ブラウザで仕事をすることの副作用として、ページとそのWebAssemblyモジュールがキャッシュされたあとは、ネットワークなしでもツールを再び使えるのが普通です。飛行機で契約書を開き、ページを編集し、ノートPCから1パケットも出さずに新しいPDFを保存できます。これはプライバシーポリシーがどれほど良くても、アップロード型アーキテクチャでは提供できない機能です。
また、クライアントサイドツールは遅い接続でも穏やかに劣化します。アップロードするものはなく、ダウンロードするのは結果だけ、その結果はあなたのCPUより遠くへ行く必要がありませんでした。
GDPR、HIPAA、退屈な法的メリット
規制当局は個人データがどこに住み、誰がそれを見られるかを大いに気にします。「この変換のデータ処理者は誰ですか?」への最もきれいな答えは「誰でもありません、処理はユーザー自身のデバイスで起きました」です。これは法的助言ではなく、エッジケースは存在しますが、プライバシーやセキュリティのレビューにとっては「米国拠点のベンダーに送信し、その下請け処理者は付録Cに記載されています」よりも構造的にずっと簡単な物語です。
医療、法律、金融、あるいはEU住民データを扱う人にとって、クライアントサイドツールはベンダーリスク評価のカテゴリ全体を取り除きます。PDFマージャと交渉するDPAは存在しません。なぜならPDFマージャはPDFを見ないからです。
正直な限界
ブラウザが完璧な計算環境のふりをするのは不誠実でしょう。そうではありません。本物の限界があり、それにぶつかる前に知っておくべきです。
- メモリの上限。タブは通常2~4 GBの範囲で制限されます。非常に大きなPDF、複数GBの動画、巨大な画像バッチは、タブが保持できる範囲を超えることがあります。
- モバイルCPU。スマホもクライアントサイドの仕事をしますが、500ページのOCRジョブは中位スペックのAndroidではサーバーファームで同じ仕事をするよりも目に見えて遅くなります。
- サーバー側OCRはまだない。高品質なOCRモデルはまだ大きくリソース消費が多く、現状ブラウザベースのOCRは短い文書で最も良く動きます。
- コールドスタートのダウンロード。初回訪問では数MBのWebAssemblyを引きますが、これは小さなアップロードフォームより遅いです。次回以降はキャッシュされます。
- 魔法のクロスデバイス同期はない。ファイルがデバイスを離れないので、結果を別の場所に持っていきたければ自分で動かす責任があります。
アップロードが本当に正しい選択になる場合
サーバーが本当に良いツールである仕事の小さな集合があります。4時間の動画変換。2,000ページのアーカイブに対するOCR。ブラウザに送るには大きすぎるモデルが必要なもの。これらには、明示的なデータ処理契約、公開された保持スケジュール、学習に関する明確な声明を持つベンダーを選んでください。可能なら有料で。「無料」のファイル処理はどこかから資金を得る必要があり、ファイル自体が魅力的な資金源になります。
ただし、その大半を占める日常的なケースでは計算が反転しています。デフォルトは、特別な理由がない限りローカルで行う、にすべきです。
Multilitiesがどう考えているか
Multilitiesは小さなユーティリティの集まりです。PDFエディター、画像コンバーター、EXIFインスペクター、ハッシュジェネレーター、QRツールなど、すべてが1つのルールの上に作られています: ファイルはタブに留まる。アップロードエンドポイントはありません。アカウントはありません。基本層が構造的にすでにプライベートなので、より良いプライバシーを解錠する「プレミアム層」もありません。
この決定はプロダクトを必ずしも華やかではない方向に形作ります。サーバー側の同等品がより小さく速い場合でも、WebAssemblyにコンパイルできるライブラリを選びます。デバイスから離れて送信することでしか可能にならない機能には「いいえ」と言います。ブラウザのネットワークタブを開いて検証できる正直なデータパスと引き換えに、わずかに遅いコールドロードを受け入れます。
理由はイデオロギーではありません。会社が変わり、ポリシーが書き直され、元の創業者が去った5年後にも、ツールが信頼に足り続けてほしいからです。あなたのデバイスを離れなかったファイルは、誰かの将来のバージョンによって不適切に扱われることはできません。
次のアップロード前のシンプルなチェックリスト
- クライアントサイドツールがこの仕事をできるか? ほとんどのPDF、画像、ハッシュ、エンコード、変換タスクで答えはイエス。
- アップロードせざるを得ないなら、保持期間とファイルがモデル学習に使われるかを知っているか?
- 将来の侵害開示に出てくるのを見て不快に感じる文書か?
- サービスは下請け処理者のリストと本物のDPAを公開しているか、それともマーケティングページだけか?
- 結果との間にウォーターマーク、アカウント、ペイウォールがあり、ファイル自体がビジネスモデルの一部だと示唆していないか?
結びに
Webは20年かけて、まずアップロードして後から質問する習慣を私たちに教えました。技術は静かに追いつき、日常的なファイル作業の大半でその必要はなくなりました。あなたのノートPCにはすでに十分なプロセッサがあります。あなたのブラウザにはすでにライブラリがあります。PDFを変換するのに最もプライベートな場所は、あなたが今すでに開いているタブです。
その考えに惹かれたなら、Multilitiesのツールを試してください。使いながらネットワークパネルを開いてください。何が送られないかを見てください。その静けさが、すべての要点です。