|
12.03.2008, 09:54 | #1 |
Участник
|
Щас вроде похоже.
Только если задать два слова то поиск ищет эти два слова в одном сообщении и если такое сообщение есть он показывает тему этого сообщения. А нельзя ли так сделать незнаю может дополнительной галочкой какой-нибудь. Чтоб он искал эти два слова не в сообщениях, а в темах. Потому что иногда бывает. В первом сообщение кто сказал thread. Во втором кто-то сказал поток. |
|
12.03.2008, 12:15 | #2 |
Участник
|
Цитата:
Сообщение от miklenew
Щас вроде похоже.
Только если задать два слова то поиск ищет эти два слова в одном сообщении и если такое сообщение есть он показывает тему этого сообщения. А нельзя ли так сделать незнаю может дополнительной галочкой какой-нибудь. Чтоб он искал эти два слова не в сообщениях, а в темах. Потому что иногда бывает. В первом сообщение кто сказал thread. Во втором кто-то сказал поток. А также обратите внимание на: |
|
12.03.2008, 12:59 | #3 |
Участник
|
Не я не это имел ввиду.
Эта комбинация выводит все темы, в которых есть сообщения, в которых есть слово thred и поток. Т.е. если в теме есть сообщение со словом "threаd", то тема полюбому выводится не зависимо от того есть в этой теме ещё одно сообщение в котором есть "поток". Т.е. их получается больше чем хотелось бы. А комбинация and выводит меньше чем хотелось бы. Т.к. выводит темы в которых есть сообщение с участием слов thread и поток. И если они в соседних сообщениях, но в одной теме, то эта тема не попадает. Ну это просто предложение, конечно если с производительностью всё ок будет. Обратил. |
|
12.03.2008, 13:02 | #4 |
Участник
|
Цитата:
Не знаю такой фичи. Не думаю, что будем делать. |
|
12.03.2008, 18:07 | #5 |
Участник
|
попробую подвести предварительные итоги.
1. форум стал работать быстрее. В основном сказались усилия провайдера по перенестройке сервера, но и наши запросы стали лучше. А самое главное почти не используется временные таблицы, как было при fulltext-поиске. В течение дня среднее время выполнения одного запроса не превышало 20-30 тиков (раньше доходило до 500-600). 2. за счет улучшенного определения границы слов поисковые индексы уменьшились, хотя количество индексируемых слов увеличилось (теперь индексируются 2х-буквенные слова). Сейчас поисковые данные больше контента всего в 1.7 раз (до работы над поиском размер поисковых данных превышал контент в 2.4 раза). 3. за счет улучшенного определения границы слов теперь появилась возможность получить нормальную статистику частоты использования слов. Среди хитов держится слово "не" - использовалось 75391 раз. Вторым является слово "то" - 40888 раз. Третьим является слово "если" - 32342 раза. 4. По результатам анализа уточнен список запрещенных к индексированию слов. Теперь список выглядит так: Цитата:
на кто что до по во со то но как это этот этого того том там тут здесь из за для при про или даже же еще раз от вот ну ли мне меня вы вам вас мы они их его ее он она всех изначально бы просто там быть будет например случае конечно forums
5. Хотелось бы спросить у вас, уважаемые участники? Можно ли запретить индексировать слово "не"? Часто ли вы включаете частичу "не" в свои поисковые запросы? |
|
12.03.2008, 22:27 | #6 |
Участник
|
Цитата:
Сообщение от mazzy
Новый список запрещенных слов будет учтен ночью при выполенении очередных регламентных работ.
5. Хотелось бы спросить у вас, уважаемые участники? Можно ли запретить индексировать слово "не"? Часто ли вы включаете частичу "не" в свои поисковые запросы? попробую выключить частицу "не". Только на этом сэкономим на этом около 1% от индексных данных, около 2.5 Мегабайт. Список запрещенных к индексированию слов сейчас такой: Цитата:
не на кто что до по во со то но как это этот этого того том там тут здесь из за для при про или даже же еще раз от вот ну ли мне меня вы вам вас мы они их его ее он она всех изначально бы просто там быть будет например случае конечно forums
|
|