Подумалось, а не надо ли все это распознать? Было бы удобнее пользоваться. Попробовал FineReader - некоторые символы он отмечает как ошибочные, но при проверке практически все верные.
Как говориться гуртом и батьку хорошо бить. Может разбить книги на части и начать совместное распознование?