pdf2djvu — створює DjVu-файли з PDF-файлів
pdf2djvu [ { -o | --output } результуючий_djvu-файл
] [параметр...] pdf-файл...
pdf2djvu { -i | --indirect } файл-djvu-індексу [параметр...] pdf-файл...
pdf2djvu { --version | --help | -h }
pdf2djvu допускає наступні параметри:
-o, --output=результуючий_djvu-файл
Створити об’єднаний багатосторінковий документ. Записати файл у
замість стандартного виводу.
результируючий_djvu-файл
-i, --indirect=файл_djvu-індексу
Створити роздільний багатосторінковий документ. Використовувати
як назву
файлу індексу; розмістити файли-компоненти в одну й ту ж теку. Тека повинна
існувати та мати дозвіл на запис.
файл_djvu-індексу
--pageid-template=шаблонВстановлює схему найменування ідентифікаторів сторінок. Зверніться за довідкою до “Мова шаблонів” розділу опису мови шаблонів.
Шаблон за умовчанням “p{page:04*}.djvu”.
З причини переносимості ідентифікатор сторінки:
повинен складатися лише з рядкових ASCII-букв, цифр, _,
+, - та крапки,
не може починатися з +, - чи крапки,
не може включати дві послідовні крапки,
повинен завершуватися розширенням .djvu чи
.djv.
--pageid-prefix=префікс
Еквівалентно
“--pageid-template=”.
префікс{page:04*}.djvu
--page-title-template=шаблонВстановлює шаблон заголовків сторінок. Зверніться за довідкою до розділу опису мови шаблонів “Мова шаблонів”.
За умовчанням заголовок не встановлюється.
-d, --dpi=роздільна_здатність
Встанолює бажану роздільну_здатність крапок на
дюйм. За умовчанням 300 dpi. Дозволений діапазон: 72 ≤
роздільна_здатність ≤ 6000.
--media-boxВикористовувати MediaBox для визначення розміру сторінки. За умовчанням використовується CropBox.
--page-size=ширина×висота
Встановлює бажаний розмір сторінки у ширина
пікселів × висота пікселів. Дійсний розмір
сторінки може змінюватися для дотримання співвідношення та через обмеження
DjVu. (Цей параметр має пріоритет над
-d/--dpi.)
--guess-dpiСпробувати передбачити оригінальну роздільну здатність перевіряючи вбудовані зображення. Використовуйте з обережністю.
--bg-slices=n+…+n, --bg-slices=n,…,n
Встановлює якість кодування фонового шару IW44. Цей параметр схожий на
параметр -slice для c44. Зверніться за
довідкою до man-сторінки c44(1). За умовчанням
72+11+10+10.
--bg-subsample=nВстановлює відношення підвибірки фону. За умовчанням 3. Допустимі значення знаходяться між 1 та 12 включно.
--fg-colors=defaultСпробувати зберегти усі кольори переднього плану. Використовується за умовчанням.
--fg-colors=webЗменшити кількість кольорів переднього плану до веб-палітри (216 кольорів). Не рекомендується використовувати.
--fg-colors=nВикористовує GraphicsMagick для зменшення кількості явних кольорів у шарі переднього плану. Допустимі значення від 1 до 4080. Не рекомендується використовувати.
--fg-colors=blackНе використовувати будь-яку інформацію про кольори з шару переднього плану.
--monochrome
Промальовувати сторінки як монохромні зображення. З цим параметром опції
--bg- та
…--fg- не беруться до уваги.
…
--loss-level=n
Встановлює агресивність компресії з втратами. За замовчуванням 0 (без
втрат). Допустимі значення від 0 до 200 включно. Цей параметр схожий на
параметр -losslevel для cjb2. Зверніться
за довідкою до man-сторінки cjb2(1). Цей параметр приймається до уваги лише разом з параметром
--monochrome.
--lossy
Рівносильно --loss-level=100.
--anti-aliasДозволити згладжування шрифтів й векторної графіки. Не рекомендується використовувати.
--no-metadataНе витягувати метадані.
За умовчанням:
Витягуються наступні значення інформації документа:
Title, Author,
Subject, Creator,
Producer, CreationDate,
ModDate. Часові позначки форматуються відповідно до
стандарту RFC
3999. Дата і час розділені одиночним пропуском.
Відповідно витягуються (чи створюються) й оновлюються метадані XMP.
У випадку декількох вхідних документів використовуються лише метадані з першого.
--verbatim-metadataЗберігати метадані недоторканими.
--no-outlineНе витягувати зміст документу.
--hyperlinks=border-avisРобити межі посилань завжди видимими.
За умовчанням межі посилань стають видимими лише при наведенні на посилання мишкою.
--hyperlinks=#RRGGBBПримусово використовувати заданий колір для межі посилань.
--no-hyperlinks, --hyperlinks=noneНе витягувати посилання.
--no-textНе витягувати текст.
--wordsВитягти текст. Записати розташування кожного слова. Використовується за умовчанням.
--linesВитягти текст. Записати розташування кожного рядка, а не слова.
--crop-textНе витягувати текст, який знаходиться за межами сторінки.
--no-nfkcНе нормалізувати текст NFKC.
--filter-text=командний_рядок
Фільтрувати текст через командний_рядок. Даний
фільтр повинен зберегти пробіли, керуючі символи й десяткові цифри.
Цей параметр передбачає --no-nfkc.
-p, --pages=діапазон_сторінок
Specifies pages to convert. page-range is a
comma-separated list of sub-ranges. Each sub-range is either a single page
(e.g. 17) or a contiguous range of pages
(e.g. 37-42). Pages are numbered from 1.
За умовчанням конвертуються усі сторінки.
Наступні змінні оточення впливають на pdf2djvu в Unix-системах:
OMP_*Поведінкою, з точки зору розпаралелювання, можна керувати за допомогою кількох змінних оточення. За деталями зверніться до специфікації OpenMP API.
TMPDIR
pdf2djvu інтенсивно використовує тимчасові файли. програма
зберігає їх у теці, заданій цією змінною. За умовчанням
/tmp.
Мова шаблонів використовує як зразок синтаксис форматування рядків у Python-і.
Шаблон — це текст, який містить поля, оточені
фігурними дужками {}. Коли шаблон
застосовується, поля замінюються відповідним чином відформатованими
значеннями. Окрім того, {{ и }}
замінюється одиночними { и }
відповідно.
Кожне поле складається з імені змінної, за яким може слідувати зсув (не обов’язково), та специфікації формату (не обов’язково).
Зсув — ціле число зі знаком (тобто починається на + чи
-).
Формат специфікації включає двокрапку, а потім специфікатор ширини поля.
Специфікатор ширини поля — це ціле десяткове число, що визначає мінімальну
ширину поля. Якщо не вказано, тоді ширина поля обчислюється за
вмістом. Передуючий специфікатору знак нуля (0) робить
можливим заповнення нулями.
Після специфікатора ширини поля може розташовуватися знак зірочки
(*), що збільшує мінімальну ширину поля до максимально
можливої довжини змінної.
Якщо не використовується параметр --monochrome, pdf2djvu
використовує наступний простий алгоритм:
Для кожної сторінки зробити наступне:
Перетворити сторінку в растрове зображення звичайним чином.
Перетворити сторінку в інше растрове зображення пропускаючи наступні елементи сторінки:
текст,
растрові зображення з глибиною 1 біт на піксель,
векторні елементи (за винятком великих заповнених площ).
Порівняти обидва зображення, піксель за пікселем:
Якщо їх кольори збігаються, класифікувати піксель як частину фонового шару.
У протилежному випадку класифікувати піксель як частину шару переднього плану.