@o01eg , сначала конвертим на онлайн-сервисе PDF в PNG(GiF), а потом перенаправляем эти картинки к онлайн-сервису OCR - одно движение и PDF или DJVU превращается в xHTML .
А простенького онлайн-OCR не встречалось на пути?
@o01eg , самый простой но медленный OCR реализуется путём предложения пользователю какого-либо портала распознать фрагмент текста вместо оплаты за хостинг или отправку файла в хранилище (сообщения в блог или мыло) - просто и взаимовыгодно.
Встречал я web-OCR, было дело, но они или требуют регистрации, или платные - оба варианта некомфортны в пути (с мобилы)
Кстати, я книжки храню в... :) формате *.OMS (хитрый эквивалент *.HTML.GZ для oMini.ru ver.3)