Цитата:
Сообщение от
Lucky13
Рассчитывался параметр так: список пользователей сортируется по количеству сообщений по убыванию и берется какая-то выборка, например, первые 500. Из них выбираются те, кто посещал форум последнее время (>01/01/2010 + недоступно). Получившаяся выборка делится на кластеры по годам регистрации.
...
Интересно, с чем это может быть связано?
Только сейчас врубился в методику (наверное):
1. Берутся участники с максимальным числом сообщений.
2. Показываем на графике сколько участников в большим числом сообщений зарегистрировалось в разные года.
3. Делается вывод, что участников с большим числом сообщений в последние года меньше, чем было раньше.
Конечно же меньше: ведь тот кто зарегистрировался недавно имел гораздо меньше шансов набрать большое число сообщений.
Не, в общем параметр отстой: "Постоянные пользователи" != "пользователи с большим числом сообщений".
====================
поэтому вопрос в другом: откуда взялся такой резкий всплеск в 2005 году?
если посмотреть на графики числа регистраций и числа постов, то видно, что в 2005 относительно небольшое число участников сделало достаточно большое число постов.

в дальнейшем делалось меньшее среднее число постов в пересчете на каждого участника. отсюда и всплеск функции(Число-Постов / Число-Участников). Хорошо. Пусть так. И что?