Мохнатые уроды и моральные пёзды. Войти !bnw Сегодня Клубы

Текстовых данных мало (порядка 300Mb за два года), нужен полнотекстовый поиск. Востребованы редко, поэтому в памяти держать не хочется, по этой причине не подходит еластик. Идеально подошёл бы sqlite, но, как я понял, без переконпеляции с доп. модулями там проблемы со стеммингом русского языка. Ещё вариант опробовать постгресовский rum, про который писал комар, но тогда придётся держать в памяти постгрес. Можно выгружать скриптом на гитхуп и пользоваться его поиском, но там только точное совпадение слова и показывается всего два топ матча.
Какие ещё есть варианты, чтобы поменьше пердолькаться?

#S5EIO7 / @anonymous / 2857 дней назад

grep

#S5EIO7/9TZ / @lexszero / 2857 дней назад
xapian
#S5EIO7/KY2 / @stiletto / 2857 дней назад
> 300mb > редко Рекомендую grep. Погугли как там стеммер прицепить.
#S5EIO7/WO4 / @komar / 2857 дней назад
@lexszero ето
#S5EIO7/HJ2 / @stiletto --> #S5EIO7/9TZ / 2857 дней назад
grep. Если хочешь что-то buzzword compatible, можешь sphinx попробовать, он просто настраивается.
#S5EIO7/21J / @anonymous / 2857 дней назад
grep
#S5EIO7/3IL / @je / 2857 дней назад
#S5EIO7/YZ1 / @anonymous / 2857 дней назад
#S5EIO7/K0H / @anonymous / 2857 дней назад
>Востребованы редко >поэтому в памяти держать не хочется . >в памяти держать не хочется > по этой причине не подходит еластик . >Идеально подошёл бы sqlite . >держать в памяти постгрес . кстати в постгресе тоже стемминга нормального нет . >полнотекстовый поиск >grep . смешной тред. рикомендую насрать эти тексты в битчиз и искать там гуглом
#S5EIO7/T7A / @anonymous / 2857 дней назад
@anonymous > кстати в постгресе тоже стемминга нормального нет На чем он у тебя обсирается?
#S5EIO7/KN7 / @komar --> #S5EIO7/T7A / 2857 дней назад
@komar хорошо ~ лучше c пидорахоязыком только со словарём можно иметь дело
#S5EIO7/771 / @anonymous --> #S5EIO7/KN7 / 2857 дней назад
@anonymous А хуй на палец он тебе заменять не должен, ебанашечка?
#S5EIO7/TO0 / @komar --> #S5EIO7/771 / 2857 дней назад
@komar ты туповат как я погляжу впрочем, ничего нового
#S5EIO7/2MK / @anonymous --> #S5EIO7/TO0 / 2857 дней назад

@stiletto >xapian
Спасибо, похоже именно то, что хотелось!

#S5EIO7/7ZG / @anonymous --> #S5EIO7/KY2 / 2857 дней назад

@komar > grep
Ок, но на крайний случай, там с прикручиванием к вебне те ещё костыли придётся (по grep stemming тоже сходу ничего не гуглится).

#S5EIO7/9MO / @anonymous --> #S5EIO7/WO4 / 2857 дней назад

@anonymous >sphinx
Поддерживает только mysql и postgresql.

#S5EIO7/53Z / @anonymous --> #S5EIO7/21J / 2857 дней назад

apache lucene / solr ( в зависимости от того насколько сильно тебе не хочется пердолькаться)

#S5EIO7/3UJ / @hirthwork / 2857 дней назад

@hirthwork > lucene
Спасибо, если с Xapian не выйдет, попробую PyLucene, но там питон съел жабу, хотелось бы избежать.

#S5EIO7/FQA / @anonymous --> #S5EIO7/3UJ / 2857 дней назад
@lexszero двоч
#S5EIO7/9CI / @mugiseyebrows --> #S5EIO7/9TZ / 2856 дней назад
ipv6 ready BnW для ведрофона BnW на Реформале Викивач Котятки

Цоперайт © 2010-2016 @stiletto.