Ukrainian (UA)Russian (CIS)

Создание электронного документа в формате PDF

Задание: создать документ (статью, книгу и т.д.) в формате PDF из сканированных изображений.

Инструментарий: любой дистрибутив Linux, руки (прямые) :-)

1. В командной строке переходим к каталогу из сканированными изображениями (Внимание! Важно, чтобы нумерация в названиях файлов изображений была такой, чтобы исключалась их неправильная сортировка. Например: неправильно: 1.jpg, 2.jpg, ..., 23.jpg, ..., 125.jpg; правильно: 001.jpg, 002.jpg, ..., 023.jpg; ..., 125.jpg.).

2. Выполняем следующую команду:

convert *.jpg -adjoin document.pdf

Понятно, что если у вас изображения в формате tif, то вместо *.jpg следует набрать *.tif

3. Ждем завершения процесса (длительность зависит от количества изображений и их объема).

Примечание: Если на попытку выполнить команду convert вам был дан ответ, что такая команда не найдена, то в этом случае следует для начала установить консольный редактор изображений ImageMagick. Но такая ситуация очень маловероятна, так как у большинства современных дистрибутивов Linux этот пакет устанавливается по умолчанию.

Весь процесс можно посмотреть также на видео:

Но практика использования описанного выше способа создания многостраничных документов в формате PDF, показала, что он не всегда срабатывает: попытка конвертировать совокупность сканированных изображений в документ PDF часто завершается ошибкой "Segmentation fault", что, собственно, является багом утилиты convert в некоторых версиях консольного редактора изображений ImageMagick.

Обойти эту проблему можно следующим образом: сначала нужно каждое изображение конвертировать в отдельный файл PDF, а потом эти файлы склеить в один многостраничный файл PDF

Чтобы не выполнять команду convert для каждого файла отдельно, следует реализовать процесс конвертации группы файлов циклом. Для этого набираем в командной строке следующую команду:

for i in *.jpg; do convert $i $i.pdf; done

Результатом исполнения этой команды будет совокупность одностраничных PDF-файлов.

Для склеивания этих файлов в один документ необходимо установить консольную утилиту pdftk (есть в официальных репозиториях Ubuntu Linux).

Когда утилита будет установлена, для склеивания PDF-файлов достаточно будет выполнить следующую команду:

pdftk *.pdf cat output my.pdf

После завершения процесса в каталоге появится многостраничный документ в формате PDF (в данном случае файл my.pdf)

Ход выполнения этого альтернативного способа можно также посмотреть на видео:

 

 

Комментарии  

 
# 13.08.2010 21:43
Спасибо отличный материал
Ответить | Ответить с цитатой | Цитировать
 
 
# 02.12.2011 11:41
Поклон Вам Земной ! Просто ГЕНИАЛЬНО !!!
Ответить | Ответить с цитатой | Цитировать
 
 
# Strix 02.12.2011 17:41
Спасибо!
Ответить | Ответить с цитатой | Цитировать
 

Добавить комментарий


Защитный код
Обновить

Поиск
Пользовательского поиска