Со вчерашнего дня, 24 февраля 2025 года, крупнейший интернет-магазин книг запрещает нам загружать книги на компьютер для переноса их на другое устройство. В этой статье мы рассмотрим, как продолжить загрузку книг с Amazon. Я уточняю, что мы собираемся схитрить. Это не загрузка самой книги, а скрипта, который делает скриншоты, и программы, которая распознает текст.
Очевидно, что мы не призываем наших читателей нарушать положения и условия или законы об интеллектуальной собственности. Но бывают случаи, как в моем случае, поскольку я страдаю нарушением зрения, и в таких случаях параметры конфигурации ридера Amazon недостаточны, и нам необходимо иметь возможность вносить изменения.
«Почему нельзя загрузить больше книг на компьютер?»
Вам нужно понять, что с помощью таких сервисов, как Amazon, мы покупаем не книгу, а право ее прочитать.. Компания оставляет за собой право удалять или изменять контент. В 2009 году английские версии 1984 y Скотный с тысяч устройств, поскольку у издателя не было прав на публикацию. В прошлом году издательство Puffin Books, издательство многих англоязычных книг Роальда Даля, переработало такие знаковые произведения, как Матильда y Чарли и шоколадная фабрикаи сделать их более политкорректными, плавно удалив такие слова, как «толстый» и «уродливый» с устройств покупателей.
Если бы Amazon продолжал разрешать загрузку на компьютер, пользователь мог бы прекрасно восстановить исходный файл. Теперь, если Безос решит завоевать расположение Трампа, изменив название Мексиканского залива на залив Америка в купленном вами Атласе, то нам придется с этим смириться.
Этот шаг касается только загрузки книги на ваш компьютер для переноса на другое устройство; вы можете продолжить загрузку ее с вашего устройства Kindle на ПК для использования на нем.
Как продолжить загрузку книг с Amazon
Что мы собираемся сделать, так это использовать облачная электронная книга от Amazon и скрипт, который делает снимок экрана, автоматически переворачивает страницу и повторяет процесс. Мы установим две программы. Xdotools и Scrot
sudo apt install xdotool scrotA
Xdotoll имитирует поведение мыши, Scrot заботится о снимках экрана.
Теперь нам нужно сделать следующее:
- Мы открыты ридер в облаке.
- Выбираем книгу, которую хотим скачать, и открываем ее.
- Нажмите на буквы в верхнем левом углу и выберите макет в 1 колонку. Это облегчает последующее распознавание текста.
- Не закрывая браузер, открываем терминал, уменьшаем его размер и размещаем в левой части экрана.
- Мы пишем
xdotool getmouselocation
и не нажимая Enter перемещаем указатель на кнопку перелистывания страниц на ридере Kindle - Нажимаем Enter.
- Мы принимаем к сведению значения X и Y, отображаемые терминалом.
Далее мы создадим скрипт, который будет делать снимки экрана. В текстовом редакторе вставляем это.
#!/bin/bash
while [ 1 ]; do
xdotool mousemove XXXX YYY click 1 &
scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/libro/'
sleep 20
done
Этот скрипт помещает указатель мыши в положение кнопки изменения (вам нужно заменить X и Y на записанные нами значения, сменить страницу, сделать снимки и подождать 20 секунд, чтобы повторить процесс).
Мы сохраняем его под именем скрипт.sh
Папку книги создаем командой:
mkdir libro
Открываем книгу в браузере и в свернутом терминале пишем
./script.sh
Разворачиваем браузер на весь экран и ждем, пока он завершит захват последней страницы. По завершении необходимо закрыть терминал.
Теперь устанавливаем программу, которая нам нужна для объединения изображений в PDF.
sudo apt install img2pdf
Для выполнения преобразования мы используем следующую команду:
find . -name "*.png" -print0 | sort -z | xargs -0 img2pdf -o libro.pdf
Вполне возможно, что за то время, которое потребовалось вам для закрытия предыдущего скрипта, произошел повторный захват, поэтому желательно убедиться в этом перед выполнением команды.
Для конвертации PDF в текст лучше всего использовать Google Documents.. Загружаем файл, нажимаем на пунктирную линию, чтобы открыть меню файла и в Открыть с помощью Google Docs. Это автоматически выполнит распознавание символов, которое вы можете сохранить в формате ODT или PDF.
Это также можно сделать из командной строки. но он не будет хорошо работать со сложными конструкциями.
Устанавливаем программы
sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-spa
Мы конвертируем PDF в текст с помощью команды:
ocrmypdf -l spa libro.pdf libro_ocr.pdf