Traduco dal sito stesso di WebCleaner : La prima funzionalità di WebCleaner che lo distingue dagli altri proxy è il filtro esatto dell’HTML, questo rimuove gran parte degli annunci non desiderati.Il filtro non sostituisce solo alcune stringhe, ma analizza tutti i dati HTML.
Il parser è veloce (scritto in C) e può far fronte ad ogni pagina HTML; se il parser non riconosce le strutture dell’HTML, esso passa i dati sopra il proxy fino al nuovo riconoscimento di un tag.
Nessun dato HTML valido è mai scartato o cassato.
Un’altra funzione è il filtraggio JavaScript: le istruzioni Javascript sono eseguite nel motore integrato Javascript di Spidermonkey che inoltre è usato dalla suite Mozilla. Ciò elimina tutti gli script offuscati, popup e cose come “document.write ()”, le altre funzioni di Javascript funzioneranno come di consueto.
Il filtro esatto HTML ha un’altro aspetto positivo: è possibile rilevare ed impedire i difetti di sicurezza conosciuti nei processori HTML. Vari (ma non tutti) exploit buffer overflow o attacchi Denial of Service sono riconosciuti e sistemati dal codice della classe HtmlSecurity.
Seguono una lista delle funzionalità:
- rimozione dell’HTML non gradito(annunci, flash, ecc.)
- blocco delle popup
- disabilitazione delle GIF animate
- filtro immagini per grandezza, rimozione banner
- compressione di documenti “al volo” (con gzip)
- riduzione delle immagini JPEG per occupare meno banda
- rimozione/aggiunta/modifica arbitraria degli header HTTP
- configurabile da un’interfaccia web
- uso delle blacklist di SquidGuard
- modulo filtro antivirus
- riconoscimento e correzione di difetti di sicurezza di HTML
- supporto all’autenticazione proxy Basic, Digest e NTLM (non testato)
- controllo di accesso basato sui singoli host
- supporto HTTP/1.1 (connessioni persistenti, pipelining)
- supporto HTTPS (sia redirezione che filtro)
Questa è la home page di WebCleaner per chi volesse approfondire la documentazione o fare il download.