Текстовых данных мало (порядка 300Mb за два года), нужен полнотекстовый поиск. Востребованы редко, поэтому в памяти держать не хочется, по этой причине не подходит еластик. Идеально подошёл бы sqlite, но, как я понял, без переконпеляции с доп. модулями там проблемы со стеммингом русского языка. Ещё вариант опробовать постгресовский rum, про который писал комар, но тогда придётся держать в памяти постгрес. Можно выгружать скриптом на гитхуп и пользоваться его поиском, но там только точное совпадение слова и показывается всего два топ матча.
Какие ещё есть варианты, чтобы поменьше пердолькаться?
grep
@stiletto >xapian
Спасибо, похоже именно то, что хотелось!
@komar > grep
Ок, но на крайний случай, там с прикручиванием к вебне те ещё костыли придётся (по grep stemming тоже сходу ничего не гуглится).
@anonymous >sphinx
Поддерживает только mysql и postgresql.
apache lucene / solr ( в зависимости от того насколько сильно тебе не хочется пердолькаться)
@hirthwork > lucene
Спасибо, если с Xapian не выйдет, попробую PyLucene, но там питон съел жабу, хотелось бы избежать.