0

Intervento su Gimp all’Open Source Day 2013 (30 Novembre)

Banner dell'evento

Il 30 Novembre a Udine si terrà l’Open Source Day 2013, una importante «manifestazione organizzata annualmente da AsCI ed IGLU Gruppo Linux Udine con lo scopo di divulgare, tramite talk, workshop e molto altro, i programmi e la filosofia Open Source». Quest’anno sono stato invitato a partecipare come relatore e terrò una conferenza su Gimp, la quale è stata inclusa all’interno del percorso Multimedia:

Percorso Multimedia (Aula 1)

Gli altri percorsi della manifestazione sono Embedded, Professional, Security e Forensics. È superfluo dire che approfitterò dell’occasione per seguire quanti più interventi possibile relativi all’informatica forense. ;) Per maggiori informazioni vi rimando al programma ufficiale linkato qui sotto.

Ci vediamo a Udine!

Via Conferenze Open Source Day 2013.

0

Aggiornata la guida all’installazione dei codec di Ubuntu

Data la recente chiusura del repository Medibuntu, ho aggiornato la mia guida all’installazione dei codec, la quale rimane attualmente uno degli articoli più consultati su questo blog. Le indicazioni sono valide anche per le versioni precedenti di Ubuntu (almeno dalla 12.04 in poi). ;)

Nel caso in cui abbiate ancora attivato il repository di Medibuntu, vi consiglio di disattivarlo al fine di non ricevere errori durante gli aggiornamenti.

19

Avviso importante: nuovo server per il download da Video Mediaset

Come avrete notato non ho scritto molto quest’estate, inoltre ho tenuto in sospeso un paio di articoli addirittura dal tardo 2012. Questo è successo per una signora molto dispotica chiamata “tesi di laurea”, la quale tuttavia oggi è stata gentilmente salutata e non disturberà più. :D Nel frattempo ho provveduto anche ad aggiornare questo strumento (lo script) messo a disposizione sul blog, e se lo utilizzate è importante che leggiate di seguito.

I miei script per salvare i video dai siti di Rai, Mediaset e La7 hanno riscosso un successo notevole e vengono utilizzati quotidianamente da molte persone. Questo mi fa molto piacere, tuttavia recentemente ci sono stati alcuni problemi con lo script per video.mediaset.it.

I più tecnici tra di voi avranno infatti già notato che il mio script per Greasemonkey e Tampermonkey, installato dagli utenti, si interfaccia con un server intermedio per ottenere i link ai video. La situazione è illustrata meglio in figura e di seguito è spiegato passo-passo.

Schema di funzionamento dello script per il download da Video Mediaset

Schema di funzionamento dello script per il download da Video Mediaset

Procedimento:

  • l’utente scarica Greasemonkey o Tampermonkey e poi installa il mio script
  • lo script chiede al server pubblico (in verde) gli indirizzi dei file corrispondenti al video visualizzato dall’utente
  • il server pubblico interroga il server segreto (in rosso) richiedendogli di scovare i link
  • quest’ultimo trova i link sul sito di Mediaset e li rimanda indietro
  • il mio script mostra in un riquadro i video e l’utente li visualizza

Il server pubblico era (ed è) una pagina ospitata su uno dei tanti servizi di free hosting statunitensi. Si tratta del sito il cui indirizzo è incluso nel codice sorgente del mio script. Tale pagina ha lo scopo di interfacciarsi e mascherare il vero server (quello “segreto”) che si occupa di trovare i link per voi. Quest’ultimo è ubicato in Italia e si maschera sia da PC che da telefono cellulare. Non è opportuno che io fornisca ulteriori dettagli in merito. ;)

Gli scopi sono due:

  1. estrarre anche i link in formato MP4 per cellulari, cosa non possibile su Chrome senza interventi manuali e tediosi da parte dell’utente
  2. permettere anche a chi risiede all’estero di vedere le trasmissioni

Veniamo al problema: il tremendo successo dello script, unito ad alcuni problemi ricorrenti al precedente servizio di hosting, hanno fatto sì che per alcuni giorni i link non comparissero, in quanto il sito veniva disattivato perché sovraccarico. Questo inoltre è successo più di una volta ed è risultato per me nel ricevere numerosi commenti, tweet e messaggi via email chiedendo lumi, oppure suggerendo che lo script dovesse essere aggiornato.

Non sarebbe stato un problema anche se ero in tesi, ad eccezione del fatto che voi utenti avreste dovuto attendere qualche giorno. Tuttavia il fatto che non dipendesse da me rendeva impossibile risolvere la situazione rapidamente, a meno di non cambiare completamente le cose.

È quello che ho fatto.

Ho attuato lo spostamento del server pubblico (di fatto un “collo di bottiglia”) su un altro hosting, che uso già per il mio blog secondario. Ho usato, con un po’ di simpatia, l’indirizzo http://video.lazza.dk (non si vede granché perché non è un sito con contenuti, ha il solo lo scopo di servire il mio script). :D

Oltre a questo, mi sono premurato di proteggere il sito dal “troppo successo”: ora il dominio viene gestito tramite CloudFlare, un servizio che fa da CDN e DNS. Senza entrare nei dettagli, diciamo che tiene a disposizione delle copie degli indirizzi dei video più cliccati, così spesso il server pubblico non viene neppure “toccato” e l’utente riceve subito una risposta. Inoltre protegge da attacchi informatici di vario genere.

Questo riduce il carico e aumenta drasticamente l’affidabilità del servizio. Per questo è importantissimo che controlliate di avere lo script aggiornato. Da stasera, coloro i quali saranno rimasti alla versione vecchia per qualche motivo, vedranno un video “di avvertimento” che li invita ad aggiornare.

Per aggiornare lo script recarsi nell’apposito articolo e seguire le istruzioni per installarlo. La versione aggiornata sostituirà quella precedente.

Ricordo che se utilizzate già una versione non troppo vecchia dello script l’aggiornamento dovrebbe essere automatico e sarà già avvenuto mentre state navigando. ;) Mi spiace per aver richiesto la vostra attenzione per il tempo necessario a leggere questo post, tuttavia lo script viene acceduto in media da 250 visitatori unici ogni giorno, con picchi di 1000 richieste di video quotidiane, perciò è necessario prendere le misure necessarie affinché tutto funzioni bene. :)

Buona visione!

0

Linux Day 2013 a Bassano del Grappa (VI)

Con grande piacere vi annuncio che anche quest’anno GrappaLUG si occupa di organizzare il Linux Day a Bassano del Grappa. La data che vi dovete segnare in calendario è il 26 ottobre 2013. Per chi ancora non lo sapesse, il Linux Day è una giornata culturale sul software libero. Cito dal volantino:

Il Linux Day è una giornata nazionale dedicata alla divulgazione della cultura informatica, in particolare quella legata al software libero. Durante l’evento si svolgono diversi interventi a tema, è aperto un laboratorio per tutto il giorno dove si possono provare le applicazioni libere e i membri di GrappaLUG sono a disposizione del pubblico per domande o dubbi.

Si tratta di un evento ad accesso libero e gratuito che interessa a tutti perché tutti siamo utenti di software libero, direttamente o indirettamente. Google (incluso Youtube) e Facebook usano molto software libero per fornire i loro servizi, e Linux è anche la base di Android e delle Smart TV. Se usate uno qualsiasi di questi prodotti, potete goderveli perché esiste il software libero, quindi perché non scoprirne di più? ;)

Quest’anno il focus di GrappaLUG è quello di realizzare un volantino completo in digitale, tant’è vero che non abbiamo ancora stampato nulla di cartaceo ed è probabile che non lo faremo o sarà in tiratura molto limitata. Perciò eccone qui un’anteprima, cliccate e potrete leggere il programma completo e gli orari. Vi aspettiamo! :)

Volantino digitale del Linux Day 2013 a Bassano del Grappa

Volantino digitale del Linux Day 2013 a Bassano del Grappa

33

Uno script in Bash per visualizzare le dirette Rai con Linux

Nei meandri della rete a volte si nascondono delle vere e proprie gemme. Un lettore mi ha recentemente segnalato questa, indicata nel blog di Andrea Ferroni in un articolo anche un po’ vecchiotto, eppure bella e funzionante. Cito testualmente:

Installate, se non li avete già, i pacchetti mplayer e xmlstarlet. Scaricate questo script sul vostro computer, rendetelo eseguibile e rinominatelo da “rai.txt” a “rai”. A questo punto eseguitelo da console e vi comparirà l’elenco dei canali. La procedura, per chi ha Ubuntu, Debian o derivate, è:

sudo apt-get install mplayer xmlstarlet
wget -O rai http://fabrizio.zellini.org/magick/rai.txt
chmod +x rai

Per vedere RAI1, ad esempio, è sufficiente lanciarlo come ./rai 1, per RAI Sport ./rai sport.

Aggiungo anche che se non lo avete dovete installare pure curl, come mi è stato segnalato nei commenti. Lo script è stato realizzato da Fabrizio Zellini e nella sua semplicità è geniale: usa gli stream della Rai indicando gli header necessari a convincere il server che “va tutto bene” e quindi si visualizzano le dirette con Mplayer. Il risultato è una aggiunta perfetta al mio script che consente invece di vedere i video on demand del medesimo sito.

Una mia nota personale: se nel codice dello script cambiate il comando da mplayer a gnome-mplayer (posto che abbiate installato quest’ultimo) avrete la possibilità di usare una GUI un po’ più ricca e che consente di impostare il rapporto di aspetto e cose simili. ;)

È anche questo il bello del software libero: l’unione fa la forza!

Via Visualizzare gli stream delle trasmissioni RAI senza Silverlight « Informatiche {bubbakk}.

2

Usare Sage per risparmiare sulla “bolletta” del telefonino

Se state pensando che Sage sia “solo” un software open source per fare matematica siete un pochino riduttivi. Certo, è un software — o meglio una distribuzione software con un’interfaccia Python unificata — progettato per dare del filo da torcere a strumenti commerciali come Mathematica e Matlab, tuttavia nulla vi dice che lo potete usare solo per studiare matematica o fare delle ricerche scientifiche.

Ho deciso di scrivere questo post tanto per mostrare un uso “simpatico” e insolito di questo software libero, ovvero quello di risparmiare nella scelta del piano telefonico. Di recente sono tornato dalla Danimarca, perciò era il momento di passare a TIM, dato che è l’unica ad avere offerte decenti per l’utilizzo che ne faccio io e più o meno l’80% delle persone tra i 16 e i 24 anni in Italia, in particolare parlo di TIM Young.

Il “problema” quando si sceglie un operatore è che molti, se non tutti, decidono (a parte le possibili opzioni) di usare il classico piano tariffario di base che costa un buon prezzo al minuto, ma ha lo scatto alla risposta e viene tariffato a scatti anticipati di 30 secondi. Tuttavia spesso esiste anche un piano senza scatto alla risposta e tariffato al secondo, anche se il prezzo al minuto è più alto. Nel caso di TIM i piani che ho valutato sono:

Piani base di TIM presi in considerazione

Piani base di TIM presi in considerazione

Ebbene, vi mostrerò come usare Sage per dimostrare che TIM ZeroScatti è più conveniente di TIM 12 e che gli operatori si fanno una valanga di soldi con lo scatto alla risposta.

Partiamo dal principio: per gli SMS si vede subito che costano meno, ma quello poco importa visto che TIM Young dà 1000 SMS al mese inclusi nel prezzo, quindi ci interessano le chiamate. La prima cosa da fare è definire due funzioni per rappresentare le tariffe. Sage ci permette di definire e rappresentare su un grafico funzioni completamente arbitrarie, ma non solo cose del tipo 3x^2+\sin(x), bensì vere e proprie funzioni programmate in Python (anzi, nel linguaggio esteso di Sage). Ecco il codice per i due piani:


def tim_12(s):
    s = floor(s)
    while (s % 30 != 0):
        s += 1
    return 18 + 12*(s/60)

def tim_zeroscatti(s):
    s = floor(s)
    return ceil(s*20/60)

La prima è più complicata perché oltre ad arrotondare i secondi a un numero intero, ovviamente, bisogna anche incrementarli fino ad un multiplo di 30, poi sommare lo scatto. A questo punto, è sufficiente usare le funzionalità grafiche di Sage per creare in pochi semplici comandi un grafico molto chiaro:


(
    plot(tim_12, (x, 0, 240), color='blue') +
    plot(tim_zeroscatti, (x, 0, 240), color='red')
).show(axes_labels=['secondi','costo (cent)'])

Risultato finale con in rosso la tariffa ZeroScatti

Risultato finale con in rosso la tariffa ZeroScatti

Il risultato finale è che possiamo vedere a colpo d’occhio com’è la situazione. Se anche voi come me siete persone che non stanno sempre 30 minuti al telefono ad ogni chiamata, ma anzi solitamente le vostre chiamate durano meno di 2 minuti e 40 secondi allora significa che vi conviene notevolmente usare un piano tariffario senza scatto.

Detto questo, ovviamente ci vogliono pochi minuti a cambiare il codice per adattarlo alle tariffe di altri operatori e fare diverse prove in modo da scegliere la migliore, l’importante è che prima di cambiare operatore conosciate tutti i piani tariffari che potete scegliere, perché al negozio solitamente evitano di dirveli adducendo scuse cretine (ho sentito di persona frasi come “ah sì ci sarebbe anche quello che dice, però sono 20 cent al minuto”). Se non volete installare subito Sage potete provare e modificare il mio codice direttamente online sul Sage Cell Server.

Buona portabilità!

11

OCR dei PDF con Linux [Wine]

L’Optical Character Recognition è il famoso processo per cui un software analizza una immagine di un testo (solitamente stampato) e tenta di effettuarne la conversione in un documento modificabile. Questo può essere sia un semplice file di testo che una pagina formattata, dipende dal software. Sotto piattaforma Linux esistono diversi strumenti molto validi per questo “lavoro”, a cui si aggiungono alcuni siti web che svolgono questo compito. Tuttavia, io desideravo in particolare effettuare una operazione che sta diventando sempre più popolare, ovvero il cosiddetto PDF sandwich. Ci possono essere due situazioni in cui potete trovarvi ad avere questa necessità:

  1. Possedete un PDF di pagine scansionate, magari a partire da immagini belle pulite e ottimizzate con ScanTailor.
  2. Avete un PDF di un articolo scientifico compilato con \LaTeX, quindi sembra che ci sia il “testo vero” ma in realtà se provate a fare copia incolla (o una ricerca) tutto quello che viene fuori sono caratteri apparentemente privi di senso. Un esempio è questo paper, tra quelli che devo leggere per la mia tesi.

In entrambi i casi, il vostro scopo è ottenere un documento il cui aspetto esteriore sia lo stesso (quindi mantenendo le immagini) ma che sia ricercabile. Ciò viene realizzato da software appositi che creano un livello trasparente con del “vero testo” usando le tecniche OCR. Il risultato non sempre è perfetto, ma sicuramente è molto meglio di avere documenti totalmente non ricercabili. Ci sono alcune guide e script in merito, nonché un live CD nato per fare solo questo.

Tuttavia sono tutte tecniche basate sullo stesso principio: usano Tesseract oppure Cuneiform per creare un file hocr e poi hocr2pdf per creare il risultato finale. Io ho provato personalmente numerosi tutorial e programmi ma il problema è sempre lo stesso: il testo sovraimposto è spesso di dimensioni sbagliate, un po’ a casaccio, e a volte è completamente spostato rispetto alle parole visualizzate. Insomma, il risultato è indegno.

La soluzione funzionante

Alla fine mi sono arreso e ho optato per un software per Windows tramite Wine, in particolare PDF-Xchange Viewer. È un programma che nella versione a pagamento fa un sacco di cose che a me non servono, ma la versione gratuita ha un motore OCR niente male che allinea il testo precisamente e riconosce le colonne abbastanza bene.

Finestra OCR del programma

Finestra OCR del programma

La finestra di riconoscimento è molto semplice da usare e consente di scegliere la lingua e il tipo di PDF. Se il vostro PDF contiene già immagini scegliete la prima voce, ovvero Preserva contenuto originale & aggiungi livello testo. Se invece è un PDF con “falso testo” l’altra opzione vi consente di convertirlo in immagini e poi effettuare il riconoscimento. Se lo fate, vi consiglio una risoluzione di 200, che va bene anche per la stampa. A mio avviso 300 è esagerato, e crea file molto grandi. Alla fine vi basta salvare il documento PDF.

Note di installazione

Il programma si installa molto facilmente con Wine e nelle preferenze è possibile impostarlo in italiano e disattivare le voci PRO dal menu. Per effettuare l’OCR in italiano vi servirà il pacchetto di lingua addizionale, che trovate in questa pagina. L’unico problema è che a volte, con alcune versioni di Wine e (pare) di più nei sistemi a 64bit, il programma crasha quando si salva (seppure di solito il file viene salvato lo stesso). Per questo io vi consiglio di provare a installarlo con PlayOnLinux, nel quale potete testare diverse versioni di Wine e trovare un setup che per voi sia perfetto, anche se comunque non è obbligatorio farlo.

Se il vostro sistema operativo è a 64bit, potete anche risparmiare tempo e scaricare questo file .polApp [62 MB] che ho creato esportandolo da PlayOnLinux. Potete importarlo dal menu del programma, alla voce Plugins » PlayOnLinux Vault » Avanti » Restore an application. Contiene il programma impostato in italiano, i dizionari europei per l’OCR e il tema wooden per un aspetto migliore. A me funziona senza crashare, avendo impostato una versione vecchia di Wine (1.5.28).

Se invece usate Linux a 32bit e sperimentate i crash, provate anche la versione portable, alcuni asseriscono che funzioni meglio. Fatemi sapere se vi funziona e che ne pensate del programma!