09.08.2010, 20:04 | #1 |
Участник
|
Интересное наблюдение
Знакомый писал курсовую по оценке посещаемости интернет-ресурсов. Я посоветовал ему axforum и то, что у него получилось меня занитересовало. В частности один параметр, показывающий изменение числа постоянных пользователей во времени.
Рассчитывался параметр так: список пользователей сортируется по количеству сообщений по убыванию и берется какая-то выборка, например, первые 500. Из них выбираются те, кто посещал форум последнее время (>01/01/2010 + недоступно). Получившаяся выборка делится на кластеры по годам регистрации. Получилась интересная картинка (см. ниже). Здесь обозначены: анализ первых 500 пользователей (синий график), 1000 пользователей (красный график) и 2000 пользователей (желтый график). Думаю если провести анализ всех пользователей, то зависимость не изменится. Все три графика показывают наплыв активных пользователей в 2005 году, а далее снижение. Получается, что общее количество пользователей растет, а количество постоянных пользователей снижается, причем достаточно интенсивно. Например, в 2005 году на форум пришло 130 пользователей, которые оставили более 10 (анализ первых 2000 пользователей) сообщений и посещают форум до сих пор, в 2007 таких было 101, в 2009 - 69. Получается, что с каждым годом растет количество пользователей, которые "приходят и уходят", а количество постоянных уменьшается. Интересно, с чем это может быть связано? |
|
10.08.2010, 00:00 | #2 |
Участник
|
Цитата:
Интересно было бы посмотреть по этим же годам число новых зарегистрировавшихся посетителей за каждый год (не активных, а вообще всех новых). Если сначала приток постоянно рос, а потом стал спадать (а я думаю так и было), то теперь с такой же возрастающей интенсивностью эти же люди выпадают из активных посетителей (см. первый абзац). Почему пик пришелся на 2005 год? Вероятно, в связи с возросшим числом проектов и партнеров по Аксапте, после того как в 2002 году Аксапта перешла в руки Микрософта, потребовалось как раз пара-тройка лет на приведение хозяйства в порядок, выработку стратегии и воспитание партнерской сети. |
|
10.08.2010, 01:45 | #3 |
Участник
|
Цитата:
Цитата:
Сообщение от Lucky13
Рассчитывался параметр так: список пользователей сортируется по количеству сообщений по убыванию и берется какая-то выборка, например, первые 500. Из них выбираются те, кто посещал форум последнее время (>01/01/2010 + недоступно). Получившаяся выборка делится на кластеры по годам регистрации.
А что по вертикали? по горизонтали похоже года (только почему-то вывернуты наизнанку. обычно ось времени направлена вправо, а у вас года увеличиваются влево). Цитата:
Сообщение от Lucky13
Все три графика показывают наплыв активных пользователей в 2005 году, а далее снижение. Получается, что общее количество пользователей растет, а количество постоянных пользователей снижается, причем достаточно интенсивно. Например, в 2005 году на форум пришло 130 пользователей, которые оставили более 10 (анализ первых 2000 пользователей) сообщений и посещают форум до сих пор, в 2007 таких было 101, в 2009 - 69.
Включено подтверждение по email при регистрации кроме того, с этого момента список пользователей начал чиститься. а также где-то с 2006 года я совершенно сознательно начал гнать волну по поводу "профессионалов" без истории на форуме (с одним-двумя сообщениями). а также по поводу того, что дубли - плохо. в результате число дублей и повторных регистраций значильно сократилось (хотя на форуме до сих пор есть люди, имеющие несколько разных ников. в основном для поиска работы). а также в начале 2006 была введена репутация Репутация и Одобрение. Обсуждение формулы а также начали жестоко банится спамеры. если раньше, спам сообщения просто стирались, то теперь еще и пользователь в бан тут же уходит (и, кстати, не показывается в списке пользователей обычным участникам). с начала этого года был здорово проработан файл robots.txt, поэтому сейчас нет никакого смысла регистрироваться на форуме чтобы разместить ссылку в профиле и получить добавку к pageRank (pageRank не добавится). Раньше таких регистраций "ради ссылки" было много. А также с начала этого года был включен антиспам-вопрос, который тяжело обходится спамерами с массовыми инструментами (антиспам-вопрос требует индивидуальной ручной настройки, что чертовски невыгодно спамерам, им проще запулить в 10-100 других форумов, нежели копаться с этим). И так далее... Цитата:
А хз. Я не очень понимаю что "это"? число регистраций - в последнее время сознательно удерживаемый параметр. по-моему, лучше пусть человек вспомнит свой старый логин, нежели заведет новый. ================== если честно, то я не очень понимаю как "посещаемость" связана с "изменением числа постоянных пользователей"? И почему так странно определяют число постоянных пользователей? и почему не используют счетчики? вроде специально держим их общедоступными и постоянными. например, размер аудитории http://www.liveinternet.ru/stat/axfo...l?period=month |
|
10.08.2010, 02:07 | #4 |
Участник
|
Цитата:
Сообщение от Zabr
Интересно было бы посмотреть по этим же годам число новых зарегистрировавшихся посетителей за каждый год (не активных, а вообще всех новых). Если сначала приток постоянно рос, а потом стал спадать (а я думаю так и было), то теперь с такой же возрастающей интенсивностью эти же люди выпадают из активных посетителей (см. первый абзац).
Пик регистраций пришелся на 2007 год. был локальный пик в 2008. я в основном грешу на ботов и спаммеров. хотя надо признать, что 2006-2007 годы были удачными для динамикса. поэтому было много и нормальных участников. а что посчитано в первом сообщении этой ветки - я не очень понимаю. может разъяснят. было бы интересно. |
|
10.08.2010, 10:00 | #5 |
Moderator
|
|
|
10.08.2010, 15:07 | #6 |
Участник
|
Цитата:
Сообщение от Lucky13
Рассчитывался параметр так: список пользователей сортируется по количеству сообщений по убыванию и берется какая-то выборка, например, первые 500. Из них выбираются те, кто посещал форум последнее время (>01/01/2010 + недоступно). Получившаяся выборка делится на кластеры по годам регистрации.
... Интересно, с чем это может быть связано? 1. Берутся участники с максимальным числом сообщений. 2. Показываем на графике сколько участников в большим числом сообщений зарегистрировалось в разные года. 3. Делается вывод, что участников с большим числом сообщений в последние года меньше, чем было раньше. Конечно же меньше: ведь тот кто зарегистрировался недавно имел гораздо меньше шансов набрать большое число сообщений. Не, в общем параметр отстой: "Постоянные пользователи" != "пользователи с большим числом сообщений". ==================== поэтому вопрос в другом: откуда взялся такой резкий всплеск в 2005 году? если посмотреть на графики числа регистраций и числа постов, то видно, что в 2005 относительно небольшое число участников сделало достаточно большое число постов. в дальнейшем делалось меньшее среднее число постов в пересчете на каждого участника. отсюда и всплеск функции(Число-Постов / Число-Участников). Хорошо. Пусть так. И что? |
|
10.08.2010, 15:51 | #7 |
Axapta
|
Цитата:
Сообщение от mazzy
Только сейчас врубился в методику (наверное):
1. Берутся участники с максимальным числом сообщений. 2. Показываем на графике сколько участников в большим числом сообщений зарегистрировалось в разные года. 3. Делается вывод, что участников с большим числом сообщений в последние года меньше, чем было раньше. Конечно же меньше: ведь тот кто зарегистрировался недавно имел гораздо меньше шансов набрать большое число сообщений. 1. Да, но в случае выборки первых 2000 пользователей можено с некоторой погрешностью считать, что взяли вообще всех пользователей, которые тут хоть что-то пишут. Тем более, что внешний вид графика похож для всех трех выборок. 2. Нет. На графике показано только количество тех пользователей, которые до сих пор тут появляются. То есть, допустим, за этот год на форум логинились 700 пользователей из тех, которые написали хотя бы 10 сообщений. Так вот, из них 130 - те, кто зарегистрировался в 2005-м году, по 100 тех, кто зарегистрировался в 2004, 2006 и 2007 годах. 3. Делается вывод, что "костяк" форума на данный момент - это те, кто зарегистрировался в 2004-2007 годах (с пиком в 2005-м). Те, кто регистрировался позже - они или просто "читатели" (даже 10 сообщений не написали) или уже форум не посещают. P.S. mazzy, картинки слишком мелкие и не читаются. |
|
10.08.2010, 19:35 | #8 |
Участник
|
Это значит разделить большую кучку на много маленьких по некоторому признаку
Цитата:
Цитата:
Сообщение от mazzy
это всего лишь показывает, что до 2005 года регистрация была свободная, не требующая подтверждений. А с 2005 года регистрация была сознательно и здорово усложнена. для начала начали включать капчу, а потом включили подтверждение по email.
Включено подтверждение по email при регистрации кроме того, с этого момента список пользователей начал чиститься. а также где-то с 2006 года я совершенно сознательно начал гнать волну по поводу "профессионалов" без истории на форуме (с одним-двумя сообщениями). а также по поводу того, что дубли - плохо. в результате число дублей и повторных регистраций значильно сократилось (хотя на форуме до сих пор есть люди, имеющие несколько разных ников. в основном для поиска работы). а также в начале 2006 была введена репутация Репутация и Одобрение. Обсуждение формулы а также начали жестоко банится спамеры. если раньше, спам сообщения просто стирались, то теперь еще и пользователь в бан тут же уходит (и, кстати, не показывается в списке пользователей обычным участникам). с начала этого года был здорово проработан файл robots.txt, поэтому сейчас нет никакого смысла регистрироваться на форуме чтобы разместить ссылку в профиле и получить добавку к pageRank (pageRank не добавится). Раньше таких регистраций "ради ссылки" было много. А также с начала этого года был включен антиспам-вопрос, который тяжело обходится спамерами с массовыми инструментами (антиспам-вопрос требует индивидуальной ручной настройки, что чертовски невыгодно спамерам, им проще запулить в 10-100 других форумов, нежели копаться с этим). Цитата:
Могут быть еще варианты: зарегистрировался в 2001 году, но посещал последний раз форум в 2003 - скорее всего тематика форума больше пользователю не интересна. Зарегистрировался в 2009 году и в 2009 последний раз был замечен на форуме - скорее всего, спросил что-то и ушел. Может придет еще, а может и нет. Все это непостоянные пользователи. Судя по графику количество постоянных пользователей, начиная с 2005 года падает, следовательно люди приходят на форум, что-то пишут (пользователи с малым числом сообщений не рассматривались), а потом уходят. На форум приходит все меньше пользователей, которые генерят контент. Я бы сказал, каждое новое поколение таких пользователей меньше предыдущего. Вы неправильно поняли, oip правильно описал методику. |
|
10.08.2010, 21:36 | #9 |
Консультант-джедай
|
Я не фанат статистики, да и курс статистике в вузе был давно , но по-моему то, что представлено на графике, называется нормальное распределение. И за какой бы промежуток Вы его не брали (но достаточно большой), график всегда будет в виде купола
__________________
Крокодил, крокожу и буду крокодить. Человек человеку - волк , а зомби зомби - зомби. Экстремал и буду экстремать! Блога |
|
10.08.2010, 21:46 | #10 |
Участник
|
Цитата:
Сообщение от oip
2. Нет. На графике показано только количество тех пользователей, которые до сих пор тут появляются. То есть, допустим, за этот год на форум логинились 700 пользователей из тех, которые написали хотя бы 10 сообщений. Так вот, из них 130 - те, кто зарегистрировался в 2005-м году, по 100 тех, кто зарегистрировался в 2004, 2006 и 2007 годах.
http://axforum.info/forums/memberlis...=posts&page=41 то 2000 пользователей - это те, кто написал не меньше 18 сообщений. даже если убрать тех, кто не появлялся в этот год... все равно будет не меньше 10 сообщений. Цитата:
и он сформировался в 2005 году, а сейчас пополняется медленно? пусть так. и что? как этот вывод коррелирует с первоначальной задачей "посещаемостью веб-ресурсов"? на них нажать можно |
|
10.08.2010, 21:49 | #11 |
Axapta
|
|
|
10.08.2010, 21:55 | #12 |
Axapta
|
Да. Я просто поверил на слово автору, который написал про 10. Но принципиально это мало что меняет.
"Костяк" - это те, кто появляется сейчас и кто хоть немного, но пишет/писал. Скорее всего не важно, 10 сообщений, 18 или 50. Не важно потому, что из графика видно, что его вид от этого не меняется. Цитата:
"Посещаемости" - скорее всего никак. Скорее речь о том, что новых активных пользователей появляется все меньше и меньше. |
|
10.08.2010, 21:55 | #13 |
Участник
|
Цитата:
Сообщение от slivka_83
Я не фанат статистики, да и курс статистике в вузе был давно , но по-моему то, что представлено на графике, называется нормальное распределение. И за какой бы промежуток Вы его не брали (но достаточно большой), график всегда будет в виде купола
|
|
10.08.2010, 22:08 | #14 |
Участник
|
Цитата:
Цитата:
Цитата:
Спросил один раз и читает дальше. У него меньше 10 сообщений, но от этого он не становится "непостоянным" Цитата:
количество пользователей с большим числом сообщений (больше 10) было много в 2005 году. сейчас люди пишут меньше. потому что есть поиск. потому что есть теги. потому что стараемся сделать так, чтобы люди сначала поискали, а потом задавали вопрос. И вроде как получается. Не. Категорически не согласен с подменой понятий. "Постоянные пользователи" != "много пишущие пользователи". Категорически не согласен с оценкой, которая подходит для флудерских ресурсов, на которых одно и то же обсуждается по кругу снова и снова. я же приводил два графика - число регистраций и число постов. Интересное наблюдение число постов (контент) - растет с приемлемой скоростью. число регистраций - уменьшилось. но с чего вы взяли, что раньше контент генерили все зарегистрировавшиеся? с чего вы взяли, что контент генерится в год регистрации? типичная подмена понятий. Цитата:
почему вы "многопишуших" трактуете как "постоянных"? почему вы считаете что "многопишут" в "год регистрации"? совершенно несвязанные вещи. oip правильно описал? Т.е. вы берете тех, кто написал больше 10 сообщений за все время с начала регистрации и появлялся здесь в этом году И считаете их постоянными пользователями? Хорошо. Пусть число зарегистрировавшихся, многопишуших и появлявшихся в этом году имеет вид колокола (как заметил slivka_83). И что это значит? Какие выводы и рекомендации для развития форума можно сделать из такого исследования? |
|
10.08.2010, 22:08 | #15 |
Участник
|
Цитата:
Сообщение от mazzy
э-э-э... нет. если отсортировать по числу сообщений
http://axforum.info/forums/memberlis...=posts&page=41 то 2000 пользователей - это те, кто написал не меньше 18 сообщений. даже если убрать тех, кто не появлялся в этот год... все равно будет не меньше 10 сообщений. Цитата:
Очень может быть, что никак. Это же всего лишь курсовая. Что Вы пристали, к названию, оно сути не меняет. |
|
10.08.2010, 22:21 | #16 |
Участник
|
Цитата:
Просто спамеров и прочей лабуды меньше. если вы считаете пик числа регистраций в 2007 - нормальным... то я трактую как спам-волну. с которой сейчас удалось справиться. в целом, я оцениваю число специалистов по Dynamics в 800-1200 человек (потенциальная аудитория). почти все эти люди так или иначе посещали и посещают форум (возможно, не регистрируясь) даже если допустить что каждый имеет по 2 ника, то нормальное рабочее число участников - 3000-4000. Сейчас - больше 11тыс ников. На мой взгляд это вовсе не значит, что 7тыс - потерянные и неудовлетворенные люди. На мой взгляд это значит, что 7тыс - это спамеры, которые регистрировались здесь ради ссылки в профиле. и то, что здесь целая треть - нормальные участники - считаю огромным достижением данного форума. контент генерили и продолжают генерить несколько сотен участников. не было ни пиков, ни спада. (если честно, то очень хотелось бы увидеть более менее вменяемое исследование. Сформулируйте запрос к базе, я попробую его выполнить и опубликую результаты). см. также количество участников ========================= другое дело, что каждый конец лета возникает ветка об упадке форума. например, Похоже все в отпуск ушли. Одновременно или вот Снизилась активность. Виновата репутация? будет сентябрь - активность снова вернется на прежний уровень. |
|
10.08.2010, 22:25 | #17 |
Axapta
|
Новых активных пользователей все меньше и меньше. То есть, произошло некое "насыщение". Большая часть специалистов по Dynamics уже на форуме есть.
И большая их часть появилась в 2005 году или рядом. Речь только об этом. |
|
10.08.2010, 22:29 | #18 |
Участник
|
Цитата:
Цитата:
Есть такой показатель - число спама. Когда он увеличивается, то начинают бить тревогу и искать причины. Цитата:
И это вы говорите на программистком ресурсе? Хорошо. Пусть так. Так в чем суть по вашему мнению? И каковы рекомендации? |
|
10.08.2010, 22:39 | #19 |
Участник
|
Цитата:
Цитата:
Цитата:
Конечно можно читать не входя на форум, но предполагать, что раньше многие читали входя на форум, а теперь читают просто так нет оснований. [/QUOTE] Цитата:
Хотя может быть вы и правы, раньше было меньше информации, поэтому больше писали, а теперь информации много, поэтому больше ищут. Но все равно это не есть gut, если на форуме будет мало тех, кто генерит контент, то это будет уже не форум. ИМХО [/QUOTE] Цитата:
1. Контент генерят те, кто посещает форум. 2. Контент, скорее всего, НЕ будет генерить те, у кого мало сообщения. Обратное не верно. Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Цитата:
Конечно можно читать не входя на форум, но предполагать, что раньше многие читали входя на форум, а теперь читают просто так нет оснований. [/QUOTE] Цитата:
Хотя может быть вы и правы, раньше было меньше информации, поэтому больше писали, а теперь информации много, поэтому больше ищут. Но все равно это не есть gut, если на форуме будет мало тех, кто генерит контент, то это будет уже не форум. ИМХО [/QUOTE] Цитата:
1. Контент генерят те, кто посещает форум. 2. Контент, скорее всего, НЕ будет генерить те, у кого мало сообщения. Обратное не верно. Цитата:
Цитата:
Цитата:
Цитата:
Повторюсь - это приближение. В идеале нужно брать всех пользователей, просто нет возможности их взять с сайта. Цитата:
Это всего лишь анализ. Делать выводы и давать рекомендации еще рано |
|
10.08.2010, 22:39 | #20 |
Участник
|
Цитата:
ну да. нарисовали график с производной. говорят, что плохо. а почему? и что делать? я взял примерные цифры из графика по выборке в 2000 участников. и по производной (синяя линия) построил первообразную (красная линия). и? напомню, что исходное сообщение начиналось "Знакомый писал курсовую по оценке посещаемости интернет-ресурсов". Булшит? |
|