Modificare i file PDF in tutti i modi possibili

Lazza4 Agosto 2011Grafica, Linuxacrobat, adobe, distiller, editoria, ghostscript, gs, pdf, postscript, ps

Il formato PDF è ottimo per gestire i documenti, però è un po’ ostico per quanto riguarda le modifiche. Nonostante questo, ci sono molte operazioni possibili per ritoccare i documenti PDF e adattarli alle proprie esigenze. Cercherò in questo articolo di raccogliere (forse ambiziosamente) tutte le operazioni che il nostro amato Linux ci consente (descritte in almeno un modo tra quelli disponibili).

Quindi è probabile che in futuro il post venga ulteriormente aggiornato, probabilmente grazie ai vostri commenti e suggerimenti! Non parlerò dei molti modi per creare file PDF, visto che sono cose che moltissimi sanno già e comunque esula dallo scopo dell’articolo. Vi anticipo già che sul blog di Aldo, sempre piacevole da leggere, trovate un articolo simile. Abbiamo avuto la stessa idea senza saperlo e la cosa ci ha divertito.

I programmi utilizzati

Per non rendere l’articolo più complicato da leggere vi elenco qui tutti gli strumenti usati. Chiaramente tutto dipende da quale operazione volete fare (quindi non è detto che vi serviranno tutti). Rispetto ad Aldo io mischio un po’ gli strumenti ad interfaccia grafica con quelli a linea di comando, spero che non sia un problema.

pdfsam
pdftk
PDF-Shuffler
pyPdf (si installa da solo con PDF-Shuffler)
ghostscript (quasi certamente già installato)
ImageMagick
Inkscape
GIMP
poppler-utils
pdfgrep
Xournal
FontForge

Vi posso dire per certo che trovate tutti questi componenti nel gestore pacchetti di Ubuntu, ma sono convinto che qualsiasi distribuzione tra quelle più famose li comprenda nei propri repository.

Modifiche relative all’ordine delle pagine

Dividere un PDF in più parti

Pdfsam fornisce diverse opzioni attraverso l’interfaccia grafica alla sezione Split, tra le quali:

burst (divisione in pagine singole)
divisione dopo n pagine
divisione ogni n pagine
divisione delle pagine pari o dispari

Unire vari PDF

In questo caso pdfsam permette un semplice accodamento di più documenti, cosa che si può ottenere anche con pdftk usando questo comando:

pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf

Eliminare/tenere solo alcune pagine

Usando PDF-Shuffler è possibile selezionare col mouse una o più pagine (aiutandosi con i tasti Shift o Ctrl) e poi premere Canc per eliminarle. Se invece un documento contiene molte pagine e se ne vogliono preservare solamente alcune è più semplice farlo da terminale. Cito l’ottimo esempio dal post di Aldo:

Col seguente comando estraiamo le pagine 3, dalla 10 alla 20, 25, 28, 32, dalla 45 alla fine.

pdftk input.pdf cat 3 10-20 25 28 32 45-end output output.pdf

Modificare arbitrariamente l’ordine delle pagine

Tramite PDF-Shuffler si possono accodare più PDF (oppure lavorare su uno solo) e poi spostare le pagine semplicemente tramite drag’n’drop.

Alternare le pagine tra due PDF distinti (interleave)

Questo si rivela utile nel caso in cui sia necessario modificare separatamente le pagine pari da quelle dispari (per esempio per ritagliare con margini diversi) oppure quando abbiamo un documento PDF con 2 pagine per foglio che vogliamo spezzare in modo da avere pagine singole. Le istruzioni per il ritaglio le vedremo dopo, intanto supponiamo di avere due documenti, dispari.pdf e pari.pdf, da voler alternare. Il trucco l’ho trovato sul blog Binary Static, e consiste nel fare il burst dei due PDF usando nomi opportuni per le pagine, in modo che poi vengano ordinate correttamente.

pdftk dispari.pdf burst output %04d_A.pdf
pdftk pari.pdf burst output %04d_B.pdf

Si provvede dunque all’unione di tutte le pagine (è importante che non ci siano altri file PDF estranei nella stessa directory):

pdftk *.pdf cat output out.pdf

Preparare la stampa a libretto (booklet)

Per realizzare autonomamente un libretto da stampare su fogli che poi andranno piegati e rilegati insieme, è necessario ridisporre le pagine in modo che l’ordine sia corretto una volta che viene fatta la rilegatura. Si può fare facilmente passando per il formato PS (PostScript). I comandi sono i seguenti:

pdftops documento.pdf output.ps
psbook output.ps tmp.ps
psnup -pA4 -2 tmp.ps booklet.ps
rm output.ps tmp.ps
ps2pdf booklet.ps
rm booklet.ps

In pratica si converte il documento in PostScript e si ordinano le pagine a libretto. Si usa psnup (vedi più sotto) per metterlo su due pagine in formato A4 (ovviamente si può cambiare) e poi si riconverte il file ottenuto in PDF. Qua e là si fa un po’ di pulizia. Sulle differenze tra pdf2ps e pdftops consiglio di leggere questo articolo. Ricordatevi infine, quando stampate, di fare correttamente il fronte-retro!

Modifiche sull’aspetto delle pagine

Ruotare le pagine

Il modo più comodo di ruotare di 90° o 180° a piacimento alcune (o tutte le) pagine di un PDF, è quello di usare PDF-Shuffler. Una volta selezionate le pagine desiderate (aiutatevi sempre con i tasti Ctrl o Shift), cliccate col destro per scegliere dal menu come ruotarle. Una volta finito esportate il file. Si possono ruotare le pagine anche tramite il terminale usando pdftk: consultate l’articolo di Aldo per questo aspetto.

Ritagliare i margini

Se volete ritagliare approssimativamente i bordi delle pagine, il metodo più facile è usare ancora PDF-Shuffler. Il menu contestuale ha una voce per il ritaglio, la nuova finestra che si apre vi chiede un valore in percentuale per ogni lato. Ricordate che questo valore è sempre relativo alla pagina di partenza, anche se lo cambiate successivamente.

Se invece avete un documento con bordi precisi dove ritagliare, dovrete ricorrere a un sistema un po’ più macchinoso. Per questo avrete bisogno innanzitutto di convertire la pagine da ritagliare in una immagine dalla quale misurare dei pixel. Ne approfitto quindi per dirvi come convertire un PDF in immagini. Usate ImageMagick in questo modo:

convert -density 288 documento.pdf -resize 25% documento.jpg

Il trucco di usare una risoluzione di 288 e poi riscalare del 25% si chiama supersampling e consente di avere un’immagine precisa e con l’antialiasing. Dovete quindi aprire l’immagine con Gimp o un altro editor di immagini e misurare i pixel che volete tagliare da ogni lato. Una volta fatto questo, salvate questo codice in Python dentro a un file chiamato pdf_crop.py e dategli i permessi di esecuzione. Usatelo nel seguente modo:

pdf_crop.py -p 1.0 -m "10 20 30 40" -i documento.pdf

Cambiate i valori in pixel: in questo esempio lo script taglia il documento di 10 pixel a sinistra, 20 in alto, 30 a destra e 40 in basso.

Nei commenti è stato suggerito anche Briss, che consente di ritagliare una o più zone, in modo da poter anche dividere una pagina in più parti. Purtroppo non è disponibile nei repository però vale la pena provarlo.

Ridimensionare le pagine

Anche in questo caso si può lavorare con il documento convertito in PostScript. Si usa quindi psresize per cambiare il formato di carta e ridimensionare per il meglio il documento. Tenete presente che dovete conoscere la dimensione in centimetri prima e dopo il ridimensionamento, e calcolare che livello di percentuale è richiesto. Per esempio, per ridimensionare un A4 in A5, dovete scalare circa del 70% (cioè 0.7) e passare da una dimensione di 21×29.7 cm a una di 14.85×21 cm.

pdftops documento.pdf output.ps
pstops "1:0@0.7" output.ps scalato.ps
psresize -w 21cm -h 29.7cm -W 14.85cm -H 21cm scalato.ps ridimensionato.ps
ps2pdf ridimensionato.ps
rm output.ps scalato.ps ridimensionato.ps

Mettere più pagine in una

Come accennavo prima, per disporre più pagine in una in un documento PostScript, si può usare il comando psnup. Ad esempio, per mettere 4 pagine in una su un foglio A4, potete fare così:

pdftops documento.pdf output.ps
psnup -PA4 -4 output.ps multipagina.ps
ps2pdf multipagina.ps
rm multipagina.ps output.ps

Operazioni relative all’intero documento

Riparare un PDF danneggiato

In alcuni casi un file PDF con piccoli difetti può essere letto male dai lettori, ma si può tentare di recuperarlo. Per farlo, dovete semplicemente “unire” quel file a nessun altro, con uno dei metodi che ho indicato inizialmente (pdftk oppure pdfsam).

Sbloccare le operazioni sui PDF

Alcuni file vengono creati con il blocco su alcune operazioni, come ad esempio la stampa oppure la copia del testo. Su Linux quasi sempre non è un problema, visto che questi blocchi sono ignorati da vari lettori, però se dovete passare un documento a una persona che usa Adobe Reader potrebbe tornare utile sbloccare il PDF.

Per farlo, aprite il file in PDF-Shuffler e poi esportatelo semplicemente. In alternativa si può usare il sito PDFUnlock! per documenti fino a 5MB. Tenete presente che questo metodo funziona solo per i PDF con permessi bloccati (stampa, copia, …) e non con i PDF protetti da password per la lettura, i quali non si possono sbloccare così facilmente.

Se il file è un PDF in versione 1.5 (invece della più diffusa 1.4) PDF-Shuffler può aver problemi a esportarlo. In questo caso, avete due ulteriori alternative un po’ meno ottimali al sito PDFUnlock!:

convertire il file in PS e poi di nuovo in PDF come spiegato nel paragrafo successivo (relativo alla compressione)
aprirlo con Evince e usare la funzione di stampa “su file” per creare un nuovo PDF (perderete l’orientamento delle pagine orizzontali)

Comprimere gli elementi grafici per ridurre il peso

Di questo avevo già parlato in un altro post, in sostanza si tratta di convertire in PS e poi di nuovo in PDF: quando il documento contiene immagini molto pesanti, queste vengono compresse automaticamente.

pdftops input.pdf tmp.ps
ps2pdf tmp.ps compresso.pdf
rm tmp.ps

Aggiornamento 29/03/2015: esiste un altro metodo che in genere dà risultati migliori e permette una regolazione più precisa. Potete usare Ghostscript per creare un nuovo file scegliendo il livello di qualità delle immagini, in questo modo:

gs -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -dCompatibilityLevel=1.4 -r75 -dNOPAUSE -dQUIET -dBATCH -sOutputFile=compresso.pdf input.pdf

Le varie qualità disponibili sono le seguenti, come indicate in questo sito:

-dPDFSETTINGS=/screen   (screen-view-only quality, 72 dpi images)
-dPDFSETTINGS=/ebook    (low quality, 150 dpi images)
-dPDFSETTINGS=/printer  (high quality, 300 dpi images)
-dPDFSETTINGS=/prepress (high quality, color preserving, 300 dpi imgs)
-dPDFSETTINGS=/default  (almost identical to /screen)

Per ulteriori opzioni, fate riferimento al sito linkato sopra.

Modificare i metadati

Per cambiare le informazioni interne, come l’autore del documento, è utile prima di tutto estrapolare quelle che ci sono già:

pdftk input.pdf dump_data output info.txt

Poi si può modificare il file di testo con le opportune informazioni, e riscriverle così:

pdftk input.pdf update_info info.txt output output.pdf

Ringrazio Aldo, perché ho estratto queste istruzioni dal suo post. Cito inoltre questo stralcio dove dice che parametri si possono inserire.

Un esempio di elenco di metadati:

InfoKey: Title
InfoValue: Titolo del PDF
InfoKey: Subject
InfoValue: Soggetto del PDF
InfoKey: Keywords
InfoValue: Parole, Chiave, Del, PDF
InfoKey: Author
InfoValue: Autore del PDF

Estrarre i font

Se volete estrarre un carattere incorporato da un documento, potete usare FontForge. Aprite il programma e vi si presenterà la schermata Open font. Su Filter impostate Extract from PDF e poi selezionate il vostro file. Tenete conto che molti font nei PDF contengono solo un sottoinsieme dei caratteri, e molto spesso i font sono protetti da copyright. In alcuni casi sarà FontForge a rifiutarsi di estrarre il font.

Una volta aperto il carattere ci sono diverse ottimizzazioni da fare, leggete questo articolo per i dettagli.

Estrarre le immagini

Questo è uno dei compiti più semplici. Il seguente comando creerà una serie di immagini in formato XPM il cui nome inizia per estratta-.

pdfimages documento.pdf estratta

Estrarre il testo

Per convertire un PDF in formato TXT basta fare:

pdftotxt documento.pdf

Se volete soltanto ricercare all’interno dei documenti PDF, forse è più conveniente installare e adoperare pdfgrep. Vedete anche il paragrafo successivo riguardante il testo contenuto nelle immagini.

Effettuare l’OCR dei PDF contenenti immagini

È possibile “sovraimporre” il testo sulle immagini di un PDF in modo da renderlo ricercabile. Ho scritto un post a riguardo in cui spiego le limitazioni delle soluzioni open source e propongo l’uso di un software tramite Wine.

Annotare e riempire i moduli

Esistono due tipi di moduli PDF. Alcuni documenti contengono dei veri e propri campi modificabili, in tal caso un lettore PDF come Evince li può tranquillamente compilare. Provate questo documento di esempio per vedere personalmente.

Se invece avete un PDF che ha semplicemente l’aspetto di un modulo e su cui volete scrivere, oppure un qualsiasi testo da annotare, potete semplicemente aprirlo con Xournal. Il programma vi fornisce un semplice strumento testo per inserire scritte dove volete e permette evidenziare o disegnare linee. Una volta finito, cliccate su File > Export to PDF per salvare un nuovo documento modificato.

Se volete fare modifiche con strumenti di disegno avanzati, potreste provare anche Inkscape. Dovete però ricordarvi che Inkscape gestisce una pagina alla volta, e se non avete installati i font presenti nel PDF le scritte potrebbero apparire diverse, sballando un po’ l’aspetto complessivo. In compenso con Inkscape avete la maggior libertà d’azione possibile, potendo spostare oggetti, eliminarli e aggiungerne di altri. Alla fine potete esportare di nuovo in PDF.

Convertire il PDF in formato PDF/A

Il formato PDF/A è la “versione ISO” del formato PDF. Serve per documenti che devono essere conservati per anni con la garanzia di poterli sempre aprire. Pertanto a volte serve convertire un PDF in PDF/A, specialmente PDF/A-1b.

Ho fatto molti esperimenti su questo punto, ma ci sono ancora diversi problemi da sistemare prima di trovare un metodo sicuro e abbastanza automatico per usare GhostScript convertendo in PDF/A, lo stesso dicasi per i PDF prodotti con LaTeX e il pacchetto pdfx.

Consiglio pertanto l’uso di un convertitore online, come ad esempio quello di webPDF, utilizzabile cliccando qui.

Email Facebook X (Twitter)Mastodon LinkedIn Telegram WhatsApp Pocket

95 pensieri riguardo “Modificare i file PDF in tutti i modi possibili”

Mike ha detto:

4 Agosto 2011 alle 17:31

Alla lista aggiungerei http://sourceforge.net/projects/pdfjumbler/ per cancellare pagine o modificarne l’ordine. Non l’ho provato ancora su Linux ma dovrebbe funzionare.

Rispondi
Hammond_Smoking ha detto:

4 Agosto 2011 alle 17:32

Con Briss (http://sourceforge.net/projects/briss/) si può dividere una pagina in due distinte (utile per i libri fotocopiati con pagine doppie). È multipiattaforma.

Rispondi
Lazza ha detto:

4 Agosto 2011 alle 18:28

@ Mike, mi sembra che faccia le stesse cose (un po’ meno) di PDF-Shuffler, per cui non lo inserirò nel post. Meglio tenere solo una o due opzioni per ogni cosa, sennò diventa enorme. 🙂 In ogni caso grazie per la segnalazione.
@ Hammond_Smoking, peccato che non ci sia nei repository, semplificherebbe le cose. Lo metto alla voce del ritaglio. 😉 Io per dividere le pagine in due di solito faccio due copie del PDF, le ritaglio sulle due metà e le alterno con l’interleave (sì, è macchinoso!).

Rispondi
Dario ha detto:

4 Agosto 2011 alle 19:02

“Esistono due tipi di moduli PDF. Alcuni documenti contengono dei veri e propri campi modificabili, in tal caso un lettore PDF come Evince li può tranquillamente compilare. Provate questo documento di esempio per vedere personalmente.”
Ancor più semplicemente si può usare Chrome per visualizzarlo e compilarlo.

Invece che tu sappia esiste un programma opensource per creare un file pdf con i campi compilabili tipo quello che hai usato per esempio?

Rispondi
Lazza ha detto:

4 Agosto 2011 alle 19:23

Chrome non è open source. 😛 No dai, comunque, per fare i moduli puoi usare Scribus. http://wiki.scribus.net/canvas/Your_first_PDF_form_with_Scribus

Rispondi
Dario ha detto:

4 Agosto 2011 alle 19:41

Sei tu che nella premessa hai parlato del “nostro amato linux” e chrome esiste anche per linux! 😉 … so che tifi per la volpe…

Grazie per la dritta su scribus, voglio proprio vedere come funziona potrebbe essermi molto d’aiuto al lavoro!

Rispondi
Franz ha detto:

4 Agosto 2011 alle 20:33

io ho provato (con soddisfazione) pdfedit

http://sourceforge.net/projects/pdfedit/

🙂

Rispondi
aldolat ha detto:

5 Agosto 2011 alle 6:18

Ottimo, Andrea, molto utile: hai parlato anche di strumenti che non conoscevo!
Aspetto che finisci con la sezione su PDF/A perché mi interessa parecchio.

Grazie per la citazione! 🙂

Rispondi
Lazza ha detto:

5 Agosto 2011 alle 10:55

@ Franz, mi confermi che funziona bene? L’ultima volta che l’avevo provato faceva poco e si piantava spesso.
@ aldolat, grazie a te!

Rispondi
GiulioL ha detto:

5 Agosto 2011 alle 20:21

Anch’io per modificare un pdf ho usato pdfedit.

Rispondi
Dario ha detto:

7 Agosto 2011 alle 20:08

Una cosa che ho scoperto stasera è che pdf-shuffler se sta cercando di cancellare una pagina di un pdf protetto non dice niente e non fa il suo lavoro.. voglio dire sembra che tutto sia andato in porto ma alla fine il file con le pagine tagliate non viene salvato…
Mi sono accorto che il file era protetto perchè provando la procedura “pdftk input.pdf cat 3 10-20 25 28 32 45-end output output.pdf” da terminale mi ha detto che il file era protetto..
Era solo per avvisare se a qualcuno non funziona, magari non perde un’ora come me per capire perchè…

Rispondi
Lazza ha detto:

8 Agosto 2011 alle 9:10

Dario, e se prima lo “sblocchi” senza tagliare pagine e poi lavori sulla copia non protetta funziona?

Rispondi
Dario ha detto:

8 Agosto 2011 alle 17:31

ho provato ma evidentemente era ben protetta e non sono riuscito..

Rispondi
Lazza ha detto:

8 Agosto 2011 alle 19:19

Ho visto il file che mi hai inviato, in formato PDF 1.5… ho inserito un appunto nell’articolo con qualche soluzione alternativa. 🙂

Rispondi
Utente ha detto:

19 Settembre 2011 alle 10:05

Ciao Lazza,
hai percaso consigli su come poter fare statistiche sui PDF in Linux, nel senso conteggio parole, spazi, ecc..?
Non trovo un app decente. Se hai consigli ti ringrazio 🙂

Rispondi
Lazza ha detto:

19 Settembre 2011 alle 10:09

Onestamente no, però mi viene in mente una soluzione alternativa: converti il file in .txt e poi usi i comandi tipo wc o simili per analizzare il testo. 😉

Rispondi
crocco84 ha detto:

27 Febbraio 2012 alle 11:09

Ciao a tutti, ho un grosso problema a lavoro,
in quanto devo riuscire a creare ua procedura automatica che eseguendo un comando da riga di comando (o altra procedura automatica da visual basic) riesca a scrivere su un file pdf già esistente e a restituire un file pdf aggiornato con le scritte inserite.
ho provato in mille pdftk e anche a generare un file fdf, ma non ottengo mai un file pdf in automatico come lo vorrei.
Qualcuno può aiutarmi è urgentissimo….grazie mille

Rispondi
1. Lazza ha detto:
  
  27 Febbraio 2012 alle 18:42
  
  Visual basic? Veramente quello gira solo su Windows… Ad ogni modo, per le tue esigenze io farei un file SVG (che di fatto è XML) con Inkscape. Poi ci cambi le scritte con quelle che vuoi tu e lo converti in PDF con svg2pdf. Fatto questo, devi solo “sovraimporre” le due pagine. Lo puoi fare con PdfTk oppure con iText.
  Sì, effettivamente la sovrapposizione non l’avevo trattata, me la segno per quando aggiornerò il post. 🙂
Artur ha detto:

27 Febbraio 2012 alle 23:47

Salve!
Io recentemente mi sono imbattuto sul problema di convertire un PDF in PDF/A per poterlo inviare alla Camera di Commercio. (Le CCIAA oramai accettano solo il pdf/a).
Siccome sono su linux a casa ho cercato di risolvere questo problema su linux. Ciò che ho trovato funzionare è il seguente comando:

gs -dPDFA -dBATCH -dNOPAUSE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=pdfa_filename.pdf input1.pdf

Spero sia di aiuto a qualcuno.

(usato e testato!)

Rispondi
Lazza ha detto:

28 Febbraio 2012 alle 18:30

Hai ragione. 🙂 Ho testato di nuovo, giusto alcuni giorni fa, lo script che avevo elaborato (che sostanzialmente usa il tuo comando più un paio di altre cose) e posso confermare che funziona. Il problema che avevo avuto ad agosto, quando ho scritto il post, era che la versione di Ghostscript comunemente installata era piena di bug, perciò in alcuni casi funzionava ed in altri no.
In particolare mi dava problemi proprio da PDF a PDF/A, ed è per quello che passavo per PostScript. Proverò anche la tua versione e poi aggiornerò il post nel giro di qualche giorno. 😉

Rispondi
João Ziliotto ha detto:

31 Marzo 2012 alle 23:07

Prezado Andréa Lazzarotto.

Gostaria de indicar a você três boas ferramentas, para manipulação de arquivos PDF:

Whyteboard – http://whyteboard.org/

jPDFTweak – http://jpdftweak.sourceforge.net/

PDFTK-QGUI – http://suslic-2012.narod.ru/

Um abraço.

20120331.

João Ziliotto

Rispondi
Pingback: Modificare i file PDF in tutti i modi possibili « Il blog di Andrea Lazzarotto « willygroup's blog
Carlo ha detto:

13 Ottobre 2012 alle 21:47

Ottimo articolo! Complimenti e grazie

Rispondi
mattia ha detto:

17 Febbraio 2013 alle 21:08

Ho notato che nei files PDF dopo ogni riga è come se ci fosse un nuovo paragrafo, e questo, se si vuole convertire in altri formati (nel mio caso epub) è davvero odioso (immaginatevi un libro dove ogni riga e mezzo va a capo a metà frase e lascia uno spazio: dopo una pagina si rischia di collassare!). C’è un modo per eliminare questa caratteristica?Sia con programmi su citati che con Adobe, Grazie mille in anticipo!

Rispondi
1. Lazza ha detto:
  
  17 Febbraio 2013 alle 23:33
  
  I PDF non hanno “ritorni a capo”, semmai contengono elementi testuali e immagini che possono essere disposti in qualsiasi modo possibile. Se ho capito bene tu stai parlando di ciò che si ottiene quando fai “copia-incolla” del testo. Se è così, penso tu possa fare un “cerca e sostituisci” con l’editor di testo per rimuovere i ritorni a capo… questo però non riguarda il PDF di per se. Cosa adoperi per la conversione? Hai provato con Calibre?
2. mattia ha detto:
  
  18 Febbraio 2013 alle 15:47
  
  Io avevo provato con un programma di conversione online, comunque intendevo proprio quello: quando in un altro formato ogni riga viene considerata a se! Poi non sono molto esperto in materia…
  Ma cerca e sostituisci non è un po’ ostico per un libro intero? Cosa consigli di fare?
Lazza ha detto:

18 Febbraio 2013 alle 16:11

In effetti… comunque ti dico, per quello sicuramente ti conviene provare Calibre. http://www.we-tech.eu/3574-come-convertire-ebook-da-pdf-epub-gratis-usando-calibre

Rispondi
1. mattia ha detto:
  
  18 Febbraio 2013 alle 17:39
  
  Intanto provo quello poi dico, grazie mille 🙂
Piera ha detto:

25 Febbraio 2013 alle 8:45

Salve a tutti io ho un problema che puo’ sembrarvi banale ma non riesco a risolvere… Durante la conversione dei file in PDF il carattere si riduce e non riesco a fare convertire il documento mantenendolo il carattere originario.
Grazie per l’aiuto

Rispondi
1. Lazza ha detto:
  
  25 Febbraio 2013 alle 12:50
  
  Be’ sarebbe necessario sapere almeno il software che usi per produrre il documento e quello che usi per la conversione in PDF.
guitarist ha detto:

11 Marzo 2013 alle 1:21

ragazzi un aiutino:( ho un file in pdf e dovrei modificare le immagini presenti all’interno in ordine numerico crescente… esiste un modo??? help me:(

Rispondi
1. Lazza ha detto:
  
  11 Marzo 2013 alle 7:59
  
  Che intendi dire che devi modificarle in ordine crescente? Che modifiche vuoi farci di preciso?
Giuseppe Dilauro (@KestrelITA) ha detto:

11 Maggio 2013 alle 11:14

Ottima guida. Io però ho un problema. Ho installato nell’ordine in cui scrivo
– ghostscript pdftk e imagemagik. Tramite prompt mi reco nella cartella del file ma il comando pdftops non funge. Premetto che uso Windows xp. Se uso convert per convertire il file prima in .ps e poi di nuovo in .pdf ottengo la stessa compresssione?
Grazie

Rispondi
1. Lazza ha detto:
  
  11 Maggio 2013 alle 17:46
  
  Convert ti trasformerebbe il PDF in una immagine, non penso sia quello che tu desideri. Non ho idea di come funzioni la faccenda su Windows, ma hai provato a mettere il path completo dell’eseguibile?
Valerio ha detto:

9 Agosto 2013 alle 16:29

Ciao, sono molto inesperto in materia e le tue dritte mi sono state molto utili, tuttavia ho salvato un file pdf con numerazione delle pagine annessa, mi servirebbe sapere come faccio per eliminare la numerazione dalle pagine e inserirne una nuova perchè poichè ho unito più file pdf in uno ad ogni file la numerazione ricomincia da 1 invece vorrei che continuasse senza ricominciare. Come posso fare?

Grazie mille per il tuo aiuto!

Rispondi
1. Lazza ha detto:
  
  9 Agosto 2013 alle 19:21
  
  Potresti cercare di coprire i numeri vecchi e farne di nuovi, ma la vedo molto difficile. Molto meglio invece se puoi rigenerare i documenti che poi unisci già con i numeri di pagina giusti. 🙂
DnaX ha detto:

29 Agosto 2013 alle 10:03

Per quanto riguarda i metatadi, pdftk ha fallito nell’estrarre i dati di un PDF protetto dalla modifica (non so se riguardo la protezione o le dimensioni di 8MB). Ho trovato che invece exiftool funziona alla grande. Non ho ben capito se i metadati nel PDF sono in formato exif o è il programmino che è flessibile.

Rispondi
Lazza ha detto:

29 Agosto 2013 alle 10:21

Non è che per caso fosse un PDF 1.5? Comunque buono a sapersi che exiftool supporta anche i PDF. 😀

Rispondi
Pingback: Unire più files .pdf | aquilone
Davide ha detto:

16 Aprile 2014 alle 20:15

Buonasera a tutti. Come posso bloccare solo alcune parti di una stessa pagina di pdf, sbloccando le altre in modo che solo queste ultime siano modificabili?
Grazie
Davide

Rispondi
1. Lazza ha detto:
  
  17 Aprile 2014 alle 7:52
  
  Non mi è chiara la domanda… Che intendi con “bloccare” e “parti modificabili”?
Marco Paunescu ha detto:

17 Aprile 2014 alle 23:27

Ciao, grazie innanzitutto per il tuo articolo.

Volevo poi chiederti se sai come fare editing di un pdf di più pagine scansionate (quindi immagini) in un colpo solo. Mi riferisco a correzioni di luminosità, colori…

Grazie

Rispondi
1. Lazza ha detto:
  
  18 Aprile 2014 alle 17:13
  Trattandosi solo di immagini, direi che potresti aprire il PDF in Gimp e applicare quello che ti serve a tutti i livelli (per esempio con GMIC). Fatto ciò, ti serve un modo di salvare di nuovo i livelli in un PDF multipagina, qui indicano alcune opzioni:
  - http://registry.gimp.org/node/25400
  - https://patrick-nagel.net/blog/archives/199
  Poi volendo potresti fare tutto direttamente con Imagemagick da terminale, usando convert o mogrify. 😉
Marco Paunescu ha detto:

20 Aprile 2014 alle 15:40

Convert l’ho provato ma non ha dato i risultati sperati. Do una letta ai link per il salvataggio dei livelli come pdf multipagina, grazie 🙂

Per il plugin GMIC hai qualche link o indicazione utile?

Buona Pasqua

Rispondi
Lazza ha detto:

20 Aprile 2014 alle 19:11

Per il plugin GMIC hai qualche link o indicazione utile?

In realtà non ho consigli particolari, più che altro ti consente con facilità di applicare un dato effetto a tutti i livelli contemporaneamente. Auguri!

Rispondi
Lazza ha detto:

2 Maggio 2014 alle 17:42

A tutti quelli interessati al PDF/A: dopo ulteriori verifiche e test con Ghostscript e LaTeX, posso confermare che i validatori più precisi trovano sempre errori nei “quasi PDF/A” prodotti. Perciò ho inserito il link di un servizio di conversione online che usa il validatore e convertitore di 3-Heights e permette di convertire i PDF/A online senza problemi. Mi rendo conto che non è come una soluzione nativa, ma se c’è necessità ci si arrangia. 🙂

Rispondi
Marco Paunescu ha detto:

19 Ottobre 2014 alle 19:04

Ciao, riscrivo qui per un inghippo che non riesco a risolvere: vi risulta possibile fare l’opposto del ritaglio (tipo quello che fa Bliss), ovvero l’affiancamento di due pagine in un’unica orizzontale?

Grazie

Rispondi
Lazza ha detto:

19 Ottobre 2014 alle 22:12

Non è tipo quello che si fa con psnup al paragrafo Mettere più pagine in una?

Rispondi
Pingback: Ordinare script ed eseguibili su Linux con una comoda directory | Il blog di Andrea Lazzarotto
Manuela ha detto:

10 Aprile 2015 alle 17:47

ciao io ho un altro problema che mi sembra non sia stato trattato fino ad ora… ho la necessità di stampare degli opuscoli… partiamo da una pagina in A5… creo l’opuscolo ottenendo così un foglio A4 contenente due pagine A5… quello che mi occorre è ottenere 4 pagine A5 su un foglio A3… quindi il risultato dovrebbe essere questo su un opuscolo di otto pagine avrei questa sequenza su un foglio A3:
8,1
8,1
sulla prima facciata
2,7
2,7
sulla seconda facciata di un foglio A3
e così via con gli altri fogli… spero di essere stata chiara… Spero in una soluzione 🙂 Grazie mille

Rispondi
1. Lazza ha detto:
  
  11 Aprile 2015 alle 13:24
  In pratica vuoi stampare due copie del booklet interlacciate tra di loro. 🙂 Dopo aver generato il booklet come spiegato nel post, puoi produrre un nuovo PDF stampando su file due copie non raggruppate:
  
  L’output sarà un documento con le pagine:
```
8,1
8,1
2,7
2,7
...
```
  A questo punto puoi mandare in stampa il PDF che hai ottenuto mettendo due pagine per foglio, e ti verrà fuori una cosa simile a questa:
CIRCOLO LINER ha detto:

1 Dicembre 2015 alle 12:25

Ciao Andrea, e un saluto a tutti gli internauti. Come si evince dai commenti precedenti e’ acclarato che diverse applicazioni possono interagire sul formato PDF. Ma – come molti sanno – le app. cosiddette ”free” consentono un numero limitato di operazioni. Il caso in questione riguarda l’opportunita’ di inserire una password all’interno del file affinche’ quest’ultimo venga protetto e terzi non possano copiare il contenuto. La domanda che rivolgo a te (e agli internauti di passaggio qui): in ambiente Windows, com’ e’ possibile utilizzare la protezione a mezzo password ?! Quali applicativi ”free” consentono di agire in tal senso ?!?!
Grazie in anticipo per la/le risposte.

Rispondi
Lazza ha detto:

2 Dicembre 2015 alle 21:53

come molti sanno – le app. cosiddette ”free” consentono un numero limitato di operazioni

Se ti riferisci al software libero, questo generalmente non è affatto vero, è uno dei classici pregiudizi verso i programmi open source, purtroppo molto radicati da anni di FUD prodotto da varie aziende. Specialmente nel caso dei PDF, sono pochi i programmi proprietari in grado di fare tutto quanto è stato elencato in questo post.

Il caso in questione riguarda l’opportunita’ di inserire una password all’interno del file

Ok, a questo proposito partiamo subito col dire che questa non è una cosa opportuna. 😉

affinche’ quest’ultimo venga protetto e terzi non possano copiare il contenuto

Eh, però la password non rende il tuo file “protetto”. Se imposti una user password, questa semplicemente limiterà, nei visualizzatori PDF stupidi, alcune operazioni (stampa, copia, eccetera). Ma chiaramente i lettori PDF ben fatti ignorano tranquillamente queste impostazioni e consentono all’utente di fare ciò che è necessario. Impedire la copia del testo è solo un atto di scortesia verso alcuni utenti che potrebbero essere costretti a cambiare lettore PDF oppure sbloccare il PDF (operazione che richiede un minuto).

Se invece imposti una owner password, il file sarà apribile solo da chi la conosce. Quindi devi distribuire sia il documento che la password. Ovviamente, quando un utente ha questi due elementi, può sbloccare il documento e farne quello che gli pare.

Ricordiamoci che i sistemi di DRM colpiscono e danneggiano solo gli utenti “perbene”, non tutelano assolutamente nulla e non è il caso di usarli.

Ad ogni modo, tornando alle asserzioni sul software libero, esistono numerosi software liberi per fare quell’operazione, compresi alcuni menzionati in questo post. 😉

in ambiente Windows

Per domande su Windows, è più proficuo chiedere a chi usa Windows.

Rispondi
jimmy ha detto:

6 Dicembre 2015 alle 23:25

Estremamente interessante, solo che dividendo un pdf in A4 a doppia pagina, le pagine ottenute risultano sempre ingrandite per riadattarsi al formato A4. Sarebbe possibile invece ricavare pagine in a5, così da poterle leggere più facilmente in ebook-reader e/o tablet da 6-7 pollici? Grazie

Rispondi
1. Lazza ha detto:
  
  6 Dicembre 2015 alle 23:54
  
  In che senso “risultano sempre ingrandite per riadattarsi al formato A4”?
jimmy ha detto:

7 Dicembre 2015 alle 12:05

Innanzitutto, grazie per aver preso in considerazione il mio quesito, non mi aspettavo una risposta così celere, è per questo che scrivo solo ora.
Cerco di spiegarmi meglio: se prendiamo un foglio A4 e lo dividiamo a metà sul lato “largo” (se così posso dire) otteniamo due fogli A5; analogamente, dividendo un A3 si ottengono due A4 e così via.
Invece, con questi programmi, dall’A4 di partenza si ottengono comunque pagine A4. Dunque, per “ingrandite per riadattarsi al formato A4” intendo dire che il testo sul lato sinistro della pagina a4 di partenza finisce per occupare un’intera nuova pagina in formato A4 e quello sul lato destro un’altra nuova pagina sempre in formato A4. Mi chiedevo allora se fosse possibile come succede nella realtà, ovvero ottenere pagine A5 in modo da poterle leggere più comodamente sui dispositivi menzionati.

Rispondi
1. Lazza ha detto:
  
  8 Dicembre 2015 alle 13:39
  
  Invece, con questi programmi, dall’A4 di partenza si ottengono comunque pagine A4
  
  Be’… no. Ma anche se fosse, che differenza fa? La forma dell’A4 è la stessa dell’A5, quindi puoi vedere il foglio tranquillamente sullo schermo del tuo dispositivo. Non è che semplicemente il tuo visualizzatore PDF adatta lo zoom della pagina alla larghezza dello schermo?
jimmy ha detto:

8 Dicembre 2015 alle 18:33

Stavolta sono io che non capisco. l’A5 avrà pure la stessa forma rettangolare dell’A4, ma l’A4 misura 210×297 mm mentre l’A5 misura 148×210. Provo a spiegarmi come mi pare finora non mi sia riuscito. Se prendo un foglio A4 da 210×297, lo dispongo in orizzontale e lo divido a metà “verticalmente” ottengo due fogli A5 da 148×210; invece, con questi programmi, dividendo un foglio A4 ottengo due “fogli” sempre A4 da 210×297. Non mi pare, pertanto, sia questione di zoom; con qualsiasi visualizzatore, se visualizzo le proprietà del file, mi dice sempre che si tratta di formato a4, sia prima, sia dopo. Anzi, come dicevo nel primo quesito, il testo che prima entrava in metà A4, ora entra ingrandito in un nuovo A4. Che poi non sia possibile ottenere due distinte pagine a5, pazienza.

Rispondi
Lazza ha detto:

10 Dicembre 2015 alle 14:05

con questi programmi, dividendo un foglio A4 ottengo due “fogli” sempre A4 da 210×297

Premettendo che non hai indicato quale di “questi programmi” stai utilizzando, prendiamo per buono che tu ottenga ancora due A4.

il testo che prima entrava in metà A4, ora entra ingrandito in un nuovo A4

Ok, e io ripeto: che differenza fa, concretamente? 🙂 Andiamo di immagini che facciamo prima. Questo è un PDF A4 orizzontale da tagliare:

Qui sotto le due versioni. A sinistra la versione con due A5 ottenuta semplicemente tagliando il 50% destro (e sinistro) alla stessa pagina. A destra la versione che ho re-ingrandito a mano per farlo diventare un documento con due pagine A4:

Le pagine sono identiche. Una volta che imposti il tuo visualizzatore PDF (o lettore di ebook) per mostrarti la pagina intera, non è possibile percepire alcuna differenza tra le due versioni, che cambiano solo per livello di zoom (l’A4 è √2 volte l’A5).

Ad ogni modo, se ci tieni particolarmente a ridimensionare il PDF da A4 a A5, puoi consultare la sezione Ridimensionare le pagine del post. 😛

Rispondi
Massimo Sassanelli ha detto:

10 Marzo 2016 alle 9:18

Ciao a tutti. Vi prego cortesemente di darmi un consiglio su come velocizzare un’operazione che compio quasi quotidianamente. Ho dei files pdf contenuti in una cartella, creati con diverse versioni, poichè hanno diverse origini (alcuni creati da me, altri dai miei clienti, altri reperiti su internet). Vorrei sapere se vi è un programma che consente di selezionare la cartella (o, al massimo, tutti i files), convertendoli alla versione desiderata (magari una delle ultime) e assegnando le medesime proprietà. Spero di essere stato chiaro. Grazie mille. Ciao !

Rispondi
1. Lazza ha detto:
  
  11 Marzo 2016 alle 11:39
  Vorrei sapere se vi è un programma che consente di selezionare la cartella (o, al massimo, tutti i files), convertendoli alla versione desiderata (magari una delle ultime)
  
  Puoi farlo con Ghostscript:
```
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.5 -dNOPAUSE -dQUIET -dBATCH -sOutputFile=new-pdf1.5.pdf original.pdf
```
  Ed eventualmente automatizzarlo con un semplice ciclo while per tutti i file in una directory:
```
ls *.pdf | while read line; do
    gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.5 -dNOPAUSE -dQUIET -dBATCH \
    -sOutputFile="${line}-convertito.pdf" "$line"
done
```
  Al posto di 1.5 metti la versione desiderata.
Teppa ha detto:

24 Marzo 2016 alle 15:50

Ciao, ho bisogno di fare un operazione, ma nn riesco a capire come fare..
Ho scannerizzato alcune pagine di un libro e l’ho salvate in formato pdf.
Adesso avrei bisgono di ritagliare la parte della pagina che mi interessa (visto che non è una pagina pulita ma c’è anche la costola centrale e parte della pagina accanto) e poi poterlo reimpaginare mettendo i limiti dx e sx in maniera che possa stampare queste poche pagine in fronte retro.
Ma non riesco in nessun modo a estrapolare la parte che mi interessa per poi reimpaginarlo.
Puoi aiutarmi?

Rispondi
1. Lazza ha detto:
  
  26 Marzo 2016 alle 1:44
  
  Adesso avrei bisgono di ritagliare la parte della pagina che mi interessa
  
  In pratica stai descrivendo quello che fa ScanTailor. 😀 Usarlo è molto semplice (basta che tu gli dia le pagine in JPG), ma se vuoi c’è pure questo tutorial ufficiale piuttosto lungo e dettagliato:
  
  https://vimeo.com/12524529
Coseno Zini ha detto:

26 Marzo 2016 alle 16:53

Ciao, ho un problema che non riesco risolvere e vorrei sapere la tua opinione a riguardo.
Sei a conoscenza di qualche programma o procedura in grado di aggiungere ad un file pdf un layer su cui poter scrivere commenti e annotazioni da mantenere però separate dal pdf originale?
So che la richiesta è un po’ ostica, ma mi serve per un ragazzo disabile che frequenta la quarta superiore a cui sto insegnando ad usare latex per scrivere gli esercizi di matematica. Il layer separato mi servirebbe per permettergli di tracciare linee e commenti (ad esempio per indicare semplificazioni) mentre sta svolgendo gli esercizi e non solo alla fine.
Mi auguro di essere stato abbastanza chiaro… nel frattempo buona Pasqua

Rispondi
1. Lazza ha detto:
  
  26 Marzo 2016 alle 19:30
  
  un layer su cui poter scrivere commenti e annotazioni da mantenere però separate dal pdf originale
  
  Non sono certo di aver capito il quesito. Sostanzialmente qualsiasi annotazione (sia le “vere” annotazioni PDF che eventuali segni o disegni aggiunti con Xournal o simili) è un layer vettoriale messo sopra al PDF. Mi potresti spiegare più nel dettaglio il workflow che avevi in mente? 🙂
  
  mi servirebbe per permettergli di tracciare linee e commenti (ad esempio per indicare semplificazioni) mentre sta svolgendo gli esercizi e non solo alla fine.
  
  Visto che stiamo parlando di scrivere documenti in LaTeX, non si potrebbe a questo punto inserire le note a margini normali con \marginpar{testo}?
  
  O tu intendi dire che vorresti un file di annotazioni separato che si possa modificare vedendo il documento sotto, ma all’occorrenza poter cambiare il documento sotto (con uno più aggiornato) tenendo le annotazioni fisse?
Coseno Zini ha detto:

27 Marzo 2016 alle 22:54

Ciao e, prima di tutto, grazie per la risposta celere.
Andando alla questione intendo esattamente la seconda alternativa che hai proposto, cioè “un file di annotazioni separato che si possa modificare vedendo il documento sotto, ma all’occorrenza poter cambiare il documento sotto (con uno più aggiornato) …”.
Il latex ha i comandi necessari per mettere in evidenza semplificazioni e annotazioni, ma questa strada ha due inconvenienti: prima di tutto il ragazzo, per via della sua disabilità, è troppo lento nella digitazione dei comandi latex e, sopratutto, non riesce ad accorgersi di cosa e come semplificare dal file .tex per cui avevo pensato ad un programma per annotare pdf.
Io ho provato a usare Jarnal, che permette di caricare un pdf come sfondo, ma non di tenerlo poi separato dalle annotazioni (io almeno non ci sono riuscito, né ho trovato tutorial a riguardo).
Ho anche visto il sito di whiteboard (http://whyteboard.org/), ma non riesco a scaricarlo…
Spero di essere stato più chiaro.
Grazie
P:S.: mi sono dimenticato di dirti che il ragazzo usa Windows 10 e fargli cambiare SO non è così semplice

Rispondi