リバース・アルファブレンディングとは:AI 透かし除去の仕組み
ピクセル厳密な AI 透かし除去の核となる、リバース・アルファブレンディングの技術解説。AI インペインティングより速く正確な理由。
AI プラットフォームが生成画像に透かしを重ねるとき、よく使われるのは標準的な合成処理です。これを数学的に理解すれば、逆算して元画素を誤差なく取り戻せます。
透かしのかけ方
アルファ合成(Gemini, Grok)
多くの透かしはアルファ合成(アルファブレンディング)を使います。
watermarked = a * logo + (1 - a) * original
watermarked= 最終的に目に映る画素値a(アルファ)= 透かしの不透明度(0=不可視、1=完全不透明)logo= 透かし画素(多くの場合 白=255)original= 復元したい元の画素
スクリーンブレンド(Doubao)
豆包(Doubao)のように、スクリーンモードを使う例もあります。
result = 1 - (1 - background) * (1 - foreground)
スクリーンブレンドは、逆値同士の掛け合わせで加算的に明るくします。白文字オーバーレイに自然な発光感が出るため、よく用いられます。
逆算
アルファ合成の反転
透かしテンプレート(ロゴ画像)とアルファ値が分かれば、元画素を解けます。
original = (watermarked - a * logo) / (1 - a)
白系の透かし(logo = 255)の場合は:
original = (watermarked - a * 255) / (1 - a)
単純な代数の変形にすぎません。ニューラルネットも推測も不要、純粋に数学です。
スクリーンブレンドの反転
スクリーンブレンドの逆は次の通りです。
background = 1 - (1 - result) / (1 - foreground)
やはり純粋に数学的です。前景(透かし)の強度が分かれば、背景(原画)を厳密に求められます。
AI インペインティングより優れる理由
多くの透かし除去は AI インペインティング(例:LaMa)を使います。比較は次の通り。
| 観点 | リバース・アルファブレンディング | AI インペインティング | |--------|----------------------|---------------| | 速度 | 約 1 ミリ秒 | 300ms ~ 数十秒 | | 精度 | 数学的厳密 | 近似(新画素の生成) | | アーティファクト | なし | 色・テクスチャの食い違いの可能性 | | モデル容量 | 0 バイト(数式のみ) | 20~100MB 級のニューラルネット | | プライバシー | 専用計算サーバー不要 | 多くの場合、サーバ推論を要する |
本質的な違い: リバース・アルファブレンディングは元画素の復元、AI インペインティングは新画素の生成。透かしテンプレートが分かるなら、復元の方が常に有利です。
実装時の難所
テンプレート照合
逆算するには、次を正確に知る必要があります。
- 透かしの位置
- 透かしの形(アルファマップ)
- どのブレンドモードが使われたか
各 AI ごとにロゴ形・サイズ違い・位置ルール・不透明度の値を集め、分析する作業が要ります。
多パス処理
JPEG 圧縮のノイズは、1 回の除去だけだと誤差に効きます。当エンジンは、透かしテンプレートとの残存相関が閾値を下回るまで、品質スコア付きの多パスで改善します。
アルファゲイン補償
透かしによってロゴ上でアルファが変化する例では、複数候補の「アルファゲイン」を試し、処理領域とテンプレートの空間相関を最小化する候補を選びます。
対応プラットフォーム
PixelClean AI のリバース・アルファ(およびスクリーン)の対象例:
- Google Gemini — アルファ合成の反転
- Grok (xAI) — アルファ合成の反転
- Doubao (豆包) — スクリーンブレンドの反転
- Google AI Studio (Nano Banana) — アルファ合成の反転