DOEN! КАЧЯЕТ!
Пришлось заюзать весь доступный тулсет, включая phantomjs, wireshark и ФЛЕШПЛЕЕР. Результат требует только the usuals, правда. Приглашаю к тестированию и поливанию говном.
Мне очень понравился сабжик, посему принимаю реквесты на cli-костыли к интересным веб-сервисам, которые слэшми попробует выполнить с его использованием.
Написал костыль для savefrom на phantomjs. Получилось гораздо лицеприятнее, чем, ибо все жабоскриптоужасы выполнились аки в браузере, и мне оставалось только вытащить результат из html'ки. Пока не знаю, публиковать-ли, though.
Сегодня сабж опять поменял себе костыльсет. Я, конечно, починил скрипт, но оно начинает надоедать. Реквестирую интерпретатор js с DOM, дабы можно было этим говном не страдать.
Проапдейтил cli-костыль к savefrom. Наиболее интересный кусочек добра:
sed -e 's/.*eval(unescape(\([^)]*\)).*/print(unescape(\1));/' | js |
sed -e 's/.*>\(var[^<]*\)<.*/\1/;s/\;var s=document.*tex/\;/;s/eval(\([^;]*\))\;.*$/\1\;'\''\;print(t);/' | js |
sed -e 's#window\['\''\\x65\\x76\\x61\\x6c'\''\](f)#print(f)#' | js |
sed -e 's/eval/print/' | js |
perl -ne 's#.*?{"url":"([^"]*)".*#\1#g and print' | sed -e 's#\\\/#/#g'
Целиком - на http://w3crapcli.tk/
В жаббир постучал дев savefrom.net (для которого у меня написан один из наиболее обфусцированно выглядящих башекостылей), сказал, что почитал мои высеры и спросил, не программирую-ли я на PHP. Что бы это могло значить? ;3
Сабжевый костыль ничего не выдаёт на 'не*при*чём'. Минут десять тыкал свой башик, пока не додумался посмотреть в браузере. Грамотору - говно, и таки выдаёт пустую пустоту на такой запрос. Естьчо полущ?
Посоны, поскожите, где нынче модно брать инфу по расписанию электричек в парсябельном виде? Мой любимый rasp.yandex.ru выдаёт настолько блевотный html, что желания его парсить как-то не возникает совсем.
Запускаю сабж. Вижу красивую няшку, разноцветную, с разнообразными выделениями, подчёркиваниями и прочим каваем. Запускаю w3m -dump - вижу унылый текст. Как мне сдампить с форматированием?
Алсо, запилил костыль к gramota.ru.
Всё больше сервисов использует эти ваши жсоны в качестве api, но, в отличие от б-гомерзкого xml, я не знаю няшных cli'ных тулзов, которыми можно лего оные преобразовать, например, в csv. Реквестирую.