Короче, я с капчами так работал. На картинках может сразу не сработать, но если покурить фильтр Гаусса и с контрастом поработать (а лучше написать пайплайн который подберет правильно параметры), то может что-то проясниться. Еще можно тессеракт натренировать (я таким слава богу не занимался), если у тебя есть уже много размеченных примеров. Да, и сам в пизду пошел, мудила
Поиск по Яндекс.Диску
вот эта хуйня для мобилы которой наводишь на надпись (НА КИТАЙСКОМ) и оно худо-бедно переводит