Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Това са няколко Всички етапи са налични като подточки отляво на страницата!

Ето някой нахвърляни точки при обработка на книги. Ще се добавят разяснения за всяка стъпка със примери и варианти за да може всеки да стане възможно за по-голям кръг от хора:

...

  1. Страниците се снимат с фотоапарат или смартфон (какъвто и да е). Дори със слаба камера (1-2 Мегапиксела) качеството за разпознаване е много добро. Все пак се снима черно/бял текстов материал
  2. Най добре е да се снимата СТРАНИЦА по СТРАНИЦА. - Снимането по две, както е показано по-долу причинява прегъване и разваляне на хоризонталната подредба на редовете. Така че ако книгата не го позволява - нека да е една по една.
  3. Файловете/Снимките/PDF файла се добавят в FineReader 11 или 12 и се сканират (детайлни стъпки по-късно)
  4. Прави се бърз преглед дали няма разбити пасажи преди запомняне . Добре е да се поправят докато са още във FineReader-a, защото се сравнява лесно с оригинала
  5. Запомня се в DOC/DOCX формат  за да може да се обработи допълнително в MS Word
  6. Отварят се файла в Word и се проверява за объркани символи, тиренца при пренасяне на нов ред, замяна на 'й' с 'ѝ'

    объркани символи като § , | , « , Я , единично ц, единично н,  & ,   „   “

    и кратко - ( й ) се заменя с ударено и -  (ѝ)

    Добавят се някой от символите  (ако е нужно):

    а̀ ъ̀ о̀ у̀ ѐ ѝ ю̀ я̀

    А̀ Ъ̀ О̀ У̀ Ѐ Ѝ ю̀ Я̀
    И най-големия изврат – Й̀ ѝ̀, Й́, ѝ́!
    ударена кирилска буква се прави като в HTML кода се добавя след нея ́ за дясно ударение и ̀ за от ляво.

  7. Запомня се в WORD, и HTML формат, Ако се ползва Word2013 може и направо в PDF.
  8. PDF файла: 
    се обработва чрез ''Foxt Pdf Editor'' - като че ли има много голям набор от настройки, обработва текста, добавя обекти, преформатира и т.н  (преопъчвам ви го)
    чрез 'Foxit pdf editor' може да добави нова страница най отгоре и да се добави 'Снимка на Корицата'
    чрез http://smallpdf.com/compress-pdf може да се компресира онлайн, защото понякога снимките, ако има, може да са доста големи и надуват файла
  9. HTML файла се добавя в CALIBRE . Добавяне на doc/pdf за преобразуване в калибре не дава много добри резултати. Затова в чист хипертекс формат  (html)
  10. Преобразува се в .EPUB като се добавя снимка на корицата (по желание)
  11. От готовия epub се преобразува в mobi . Mobi е почти същото като epub, което е пък един вид опростен html формат
  12. И най-важното - споделя се с всички:
    качва се във фейсбук
    слага се в http://rulit.me
    слага се в http://libgen.in/Качва се на торент в data-bg.net и zamunda.net, arena.bg. или все някаде
  13. И най-най-най важното : Книгата да се  прочете - само в краен случай може да се разпострани без прочит .. защото все по-често така става ; )

ВРЕМЕТРАЕНЕТО за Извършване на работата е ТАКОВА:

1.Снимане полека лека 1-2 часа

2.Слагане в компютъра 20-30мин средно

3.Зареждане в FineRade и автоматична OCR обработка - зависи от Процесора .. от 5 мин до 30 мин за книга (300-400 стр)

4. Попаравка на грешките от разпознаването - ЧАСОВЕ - (от 1 час до 10-20+ часа) Зависи от самите снимки, ако са справилно  разпознати един бърз преглед по 10сек на страница стигат.

5.Обработка в Word (подравняване, шрифт, Съдържание, слагане на снимка), запомняне в DOC, PDF и HTML - ( от минути до 2-3 часа). Зависи от снимките...

6. Слагане на HTML формата в Calibre и преобразуване в EPUB, MOBI - 10-20 мин

7. Качване във фейсбук/страница/торент с описание - (10-30 мин)

 

  Неправилно снимани страници - с примери. Ако се снима с умисъл да се разпознава/отцифрова това трябва да се избягва:

...