Шлюхи без блекджека, блекджек без шлюх. Войти !bnw Сегодня Клубы

Есть ли швабодные определители уникальных характеристик стиля текста, чтобы можно было детектить, кто пишет из-под анонимуса, и детектировать семёнов?

Рекомендовали: @ulidtko
#Q5V3PL / @anonymous / 4243 дня назад

частотного анализа хватит
#Q5V3PL/R7G / @krkm / 4243 дня назад
@kurkuma Говорят, что лучше частотный анализ пар слов делать, чем просто по словам. Но тем не менее, есть ли швабодные (чтобы не писать код), ну или хотя бы бесплатные (как пиво).
#Q5V3PL/Z76 / @anonymous --> #Q5V3PL/R7G / 4243 дня назад
@anonymous бля там десяток строчек на жс или твоем любимом языке, хули ты выебываешься?
#Q5V3PL/K5K / @krkm --> #Q5V3PL/Z76 / 4243 дня назад
было
#Q5V3PL/JKE / @238328 / 4243 дня назад
@kurkuma хуётного
#Q5V3PL/57O / @238328 --> #Q5V3PL/R7G / 4243 дня назад
@anonymous напишу за отзыв, пиши мыло или ник на бнвощ
#Q5V3PL/0FQ / @238328 --> #Q5V3PL/Z76 / 4243 дня назад
@kurkuma Мне лень, напиши ты, если десяток строчек. К тому же у тебя *уже* есть обновляемая база комментариев, прикручиваешь к ней анализатор и по клику на коммент показываешь те, что с похожим стилем, сплошная выгода.
#Q5V3PL/4FY / @anonymous --> #Q5V3PL/K5K / 4243 дня назад
@anonymous мне лень, я попиливаю всякую хуйню в фиде. у тебя тоже может быть база, ставится очень просто
#Q5V3PL/G5S / @krkm --> #Q5V3PL/4FY / 4243 дня назад
пук
#Q5V3PL/FLS / @anonymous / 4243 дня назад
@anonymous нет никакой базы, ты запрашиваешь комментарии из бнвоща напрямую
#Q5V3PL/JCT / @238328 --> #Q5V3PL/4FY / 4243 дня назад
@238328 Есть. Пруфы у куркумы. Штука на ноде сосёт вебсокет и кладёт в базу (в mongodb).
#Q5V3PL/VPU / @anonymous --> #Q5V3PL/JCT / 4243 дня назад
@anonymous пук, к // штилета верни приватность
#Q5V3PL/FAA / @238328 --> #Q5V3PL/VPU / 4243 дня назад
@238328 или не возвращай
#Q5V3PL/FST / @238328 --> #Q5V3PL/FAA / 4243 дня назад
Да, JStylo, но там жаба и ппц ваще, поэтому я только их выступления на ccc смотрел и паперы читал.
#Q5V3PL/AQQ / @anonim / 4243 дня назад
@anonymous Не пар слов, а диграмм/триграмм на самом деле.
#Q5V3PL/6YP / @anonim --> #Q5V3PL/Z76 / 4243 дня назад
@anonim А в чём разница между парой (последовательных) слов и диграммой?
#Q5V3PL/J97 / @anonymous --> #Q5V3PL/6YP / 4243 дня назад
@anonymous Диграмма — это пара (последовательных) букв.
#Q5V3PL/4G2 / @anonim --> #Q5V3PL/J97 / 4243 дня назад
@anonim любые н-граммы не относятся ни к буквам, ни к чему другому можно и для букв и для слов ну и канеш кластеризация пользователей по буквам это пиздец // если ты канеш не хочешь отличить хохла от руССкого
#Q5V3PL/8T5 / @238328 --> #Q5V3PL/4G2 / 4243 дня назад
@238328 Пруф или научно // лень папер искать // см. А.С. Романов «Методика идентификации автора текста на основе аппарата опорных векторов»
#Q5V3PL/KQA / @anonim --> #Q5V3PL/8T5 / 4243 дня назад
@anonim s/лень\ папер\ искать//g
#Q5V3PL/LDF / @anonim --> #Q5V3PL/KQA / 4243 дня назад
@anonim лень читать неуважаемых
#Q5V3PL/83V / @238328 --> #Q5V3PL/KQA / 4243 дня назад
@anonim тащемта можно пройтись по бнвощу и замерить эффективность, и сказать автор хуй [для бнвоща] или нет
#Q5V3PL/F9C / @238328 --> #Q5V3PL/KQA / 4243 дня назад
@238328 Там в папере автор берет 100 наиболее частых биграмм, Тройки букв русского алфавита, 500 наиболее частых триграмм, 100 наиболее частых слов из словаря Шарова, Триграммы, сглаженные методом Гуда-Тьюринга, Триграммы, сглаженные методом Лапласа и500 наиболее частых триграмм, сглаженных методом Лапласа и тестит их на текстах. Вообще почитайте лучше паперы от тех, кто JStylo делал, они тестили на ачате, тестили переведенные гуглопереводчиком тексты и прочее и все работало, правда у них посложнее канеш, чем просто частотный анализ.
#Q5V3PL/9Y8 / @anonim --> #Q5V3PL/F9C / 4243 дня назад
@anonim я уже читаю // он просто забил хуй на анализ слов, поэтому и использовал в признаках буквенные н-граммы //
#Q5V3PL/71R / @238328 --> #Q5V3PL/9Y8 / 4243 дня назад
@anonim Анонимус не пройдёт!!!1!
#Q5V3PL/QKG / @238328 --> #Q5V3PL/9Y8 / 4243 дня назад
@anonim И правда какое-то оно сложное. Хотя ведь всё равно придётся писать код, для того, чтобы комменты руками хотя бы туда не перебивать. Плохо так жить.
#Q5V3PL/XTZ / @anonymous --> #Q5V3PL/AQQ / 4243 дня назад
@238328 Он потом запилил посложнее хуйню, см. «Структура программного комплекса для исследования подходов к идентификации авторства текстов».
#Q5V3PL/XAO / @anonim --> #Q5V3PL/71R / 4243 дня назад
@anonim лан // я напоминаю, что например в некоторых [случаях]( https://bnw.im/api/userinfo?user=238328 ) средняя длина комментария составляет `characters_count / comments_count ≈ 58` и это при том, что наверно половина это ссылки + пасты
#Q5V3PL/Q3V / @238328 --> #Q5V3PL/XAO / 4243 дня назад
@anonymous хуйод, тупой штоле, попроси базу за анал
#Q5V3PL/EXC / @238328 --> #Q5V3PL/XTZ / 4243 дня назад
@anonim тлдр, ну к
#Q5V3PL/UDC / @238328 --> #Q5V3PL/XAO / 4243 дня назад
@238328 А для этого смотри на 28c3 кажется толк, где они парсили посты с ачата и еще каких-то форумов с такими же пастами и ссылками.
#Q5V3PL/84T / @anonim --> #Q5V3PL/Q3V / 4243 дня назад
ipv6 ready BnW для ведрофона BnW на Реформале Викивач Котятки

Цоперайт © 2010-2016 @stiletto.