Precedentemente vi avevo già parlato di come gli articoli premium di Repubblica siano in realtà a pagamento solo per finta. I testi completi degli articoli infatti sono ottenibili in modo abbastanza banale perché il sito li mette a disposizione di chiunque.
Il caso era abbastanza eclatante, perché il testo di ogni articolo veniva semplicemente reso invisibile all’utente, ma effettivamente era presente. La maggior parte dei siti di notizie, invece, effettuano un vero e proprio “taglio” del contenuto. Al browser dell’utente viene mandato il primo paragrafo del testo e poi si vede un banner che invita ad abbonarsi.
Recentemente una persona mi ha chiesto se fosse un fenomeno presente anche su un altro quotidiano, ovvero LaStampa TopNews. Però penso risulti chiaro: una mancanza del genere solitamente è l’eccezione, non la regola. Stavo quindi preparandomi istintivamente a scrivere una risposta negativa.
Poi mi sono detto “vabbè dai, sono in ferie… 5 minuti li spreco, ma non uno di più”. Ho aperto uno degli articoli marcati come TopNews sul sito, in particolare questo:
http://www.lastampa.it/2018/08/22/cultura/investimenti-un-patto-per-ripartire-4Irf6mm0cDpDXY7JvmjtHI/premium.html
Ho osservato l’indirizzo e mi sono chiesto se questo avesse anche una versione di stampa. La prima cosa che mi è venuta in mente di fare, in modo del tutto istintivo, è stata di rimpiazzare il nome premium.html
con print.html
. Certo, un tentativo un po’ sciocco, ma costava poco provare. Quindi ho tentato di visitare questo URL:
http://www.lastampa.it/2018/08/22/cultura/investimenti-un-patto-per-ripartire-4Irf6mm0cDpDXY7JvmjtHI/print.html
Con mia sorpresa, qualcosa si è aperto. 🙂 La figura mostra le due pagine in questione:
Lo so, state pensando che è una cosa veramente assurda e bizzarra. L’ho pensato anch’io. 😀 Il fatto che le versioni complete degli articoli siano disponibili online a chiunque, senza login, vanifica completamente il senso del paywall. Considerando poi che i testi degli articoli sono il prodotto offerto da un quotidiano, il business ne risente sicuramente.
La cosa buffa è che nessuna delle due pagine è una “versione stampabile”, se provate a generare delle anteprime in PDF vedrete che vengono entrambe molto male.
Anche in questo caso ho creato un microscopico user-script a scopo dimostrativo, il quale funziona con le estensioni Greasemonkey e Tampermonkey. Se vi trovate su una pagina di TopNews, carica in background il testo integrale dalla versione “intera” e lo mette al posto dell’anteprima. Lo potete installare da qui:
Come sempre, lo script è solo un proof-of-concept e il sito può venire sistemato in qualsiasi momento.
Quando vedo errori del genere rimango piuttosto basito, perché per qualsiasi sviluppatore software si tratta di sbagli alquanto grossolani e gravi. Durante la progettazione di un sito web, specialmente se a pagamento, è importante operare in modo preciso e professionale e occuparsi anche di fare le relative valutazioni di sicurezza.
Anche se non c’entra appieno con l’argomento del post (cioè la sicurezza dei contenuti) preciso che lo script contiene anche una leggera modifica estetica alle pagine de La Stampa, per renderle più leggibili sui cellulari. 🙂
Ho dovuto fare una piccola modifica allo script poiché al momento i contenuti sono serviti tramite https.
Grazie!
Grazie per il tuo articolo. Funziona!
Underpass, grazie per l’utile suggerimento. La riga di Jquery (la seconda che mi hai segnalato su Greasyfork) funziona anche così ma non mi ero accorto che copiandola dai vecchi script l’avevo lasciata in HTTP… una scelta assurda in effetti, visto che c’è la versione HTTPS. 😀
Per la riga precedente invece l’ho messa in entrambe le versioni. Interessante notare come dopo due mesi dal post non sia cambiato praticamente nulla.
Ciao Andrea, scusami ma non avevo letto la tua risposta. Grazie a te, naturalmente… e “finché dura fa verdura”! 😀
Grazie!
Ringrazio l’autore. Purtroppo però da alcuni giorni TopNews ha cambiato formato e lo script non funziona più.
Hai ragione, sembra che ora il testo integrale sia disponibile a tutti nella versione AMP degli articoli, come nel caso di The Wall Street Journal.
Ciao Andrea, ho aggiunto anche https://www.lastampa.it/tuttosoldi/* visto che alcune “Top News” poi risultano di quella sezione del sito. Grazie ancora 🙂
Ottimo suggerimento, grazie. 🙂
Oggi ho fatto una prova io.
Se si carica la pagina inizialmente viene caricato tutto l’articolo che viene poi tagliato solo successivamente (in pratica caricano l’articolo, poi se non sei loggato lo tagliano).
La prova più banale che si può fare su quella stessa pagina è copiare il div prima che questo venga ricaricato e incollarlo successivamente.
Anche qui siamo di fronte ad un sistema di sicurezza che fa acqua da tutte le parti e tutto lato client.
In effetti alcune cose sono cambiate (anche nella struttura grafica) rispetto al post del 2018. Diciamo che il succo più o meno è quello. 🙂
Novembre 2020, ho visto che ora c’è un modo molto più semplice perché nel sorgente della pagina l’articolo c’è tutto, formattato in html. L’ho copiato in un editor di testo e salvato in html per leggerlo comodamente con gli accenti e l’interpunzione corretta.
Sempre più facile, sempre più lato client, sempre meno illegale (sei tu che mi mandi tutto l’articolo, mica te l’ho rubato, è lì!).
Sì è sostanzialmente il concetto di cui si parlava con Lay nel commento precedente. Giusto per chiarire, nulla di quanto viene descritto qui è illegale né lo era con la versione 2018 del sito. 🙂
Febbraio 2023_ gli script non funzionano più, nessun aggiornamento in vista?
No, non è un progetto software che viene mantenuto, era soltanto un esempio per far capire il discorso. 🙂 Come accennavo nell’articolo, che ormai ha quasi 5 anni: