Интернет-статистика

Одним из важнейших показателей эффективности интернет-сайта является его посещаемость. Технические особенности современного интернета не позволяют абсолютно точно определять посещаемость. Поэтому существует множество как различных способов подсчета статистики сайтов, так и различных сервисов, осуществляющих такой подсчет.

Для сбора и анализа различной информации о посетителях сайта используются данные, предоставляемые сетевыми протоколами. Самым простым способом получения этих данных является размещение на странице счетчика посещений.

Счётчик посещений (англ. counter) – сервис, предназначенный для независимого внешнего измерения посещаемости сайтов. Обычно счётчик состоит из двух частей:
1)код, размещаемый на страницах сайтов-участников для сбора данных, обычно представляется в виде картинки;
2)программа, подсчитывающая полученную информацию и предоставляющая её в виде статистического отчёта.

Счётчик может выступать в роли рейтинга, сортируя сайты по посещаемости, а также в качестве каталога, так как рейтинги обычно тематически структурированы. Более того, кроме непосредственно подсчета посещаемости счетчики могут определять с какого сайта, с помощью каких поисковых систем и каких запросов приходили на сайт посетители, чем они интересовались, где живут (с точностью до страны и города), как часто возвращаются на сайт и т. д.

Кроме счетчиков, статистика посещений может также вестись на основании анализа серверных логов (журналов) с помощью специальных программ.

Выделяют несколько параметров подсчета посещаемости интернет-сайтов:

  1. хосты
  2. уникальные посетители
  3. сессии
  4. хиты
  5. глубина просмотра


Хосты.
В данном случае под хостом подразумевается любой компьютер, подключенный к интернету и имеющий IP-адрес.
Однако казалось бы очевидной объективной статистики подсчет хостов не дает. Как правило, локальная сеть имеет только одно соединение с Интернетом, осуществляемое через прокси-сервер. А локальные сети сейчас используются повсюду – во всевозможных учреждениях и организациях, учебных заведениях и т. д.

Все большее распространение получают домашние сети, благодаря которым члены одной или нескольких семей могут совместно использовать одно широкополосное соединение. Во всех этих случаях многие пользователи (зачастую сотни, а иногда даже тысячи) выходят в Интернет через один-единственный сервер, и всех их считают как один хост. Из такой сети могут прийти десятки, а то и сотни посетителей, а показатель «хосты» счетчика увеличится всего на один пункт. Правда, некоторые прокси-серверы настраиваются администраторами локальных сетей так, что счетчик может определять IP-адреса пользователей, находящихся, как принято говорить, «за прокси-сервером». Но в общем случае счетчик не способен определить, откуда пришел запрос — с прокси-сервера или с одного компьютера.

Возможна и обратная ситуация. Для соединений через телефонную линию пользователи получают динамические IP-адреса, которые изменяются при каждом новом соединении. Так что счетчик посещений воспримет его как новый хост.

Все показатели, в том числе и хосты, определяются за какой-то промежуток времени. Разные счетчики выбирают этот промежуток по-разному. Если период подсчета равен суткам, то количество хостов, умноженное на 30, будет примерно равно количеству хостов, подсчитанному за месяц. Если нет – разница может оказаться весьма существенной.
Таким образом, показатель посещаемости «хосты» является весьма неточным. Однако многие, не желая вдаваться в тонкости статистики, все еще ориентируются именно на него.

Уникальные посетители. Поскольку точность определения посещаемости с помощью показателя «хосты» оставляет желать лучшего, серверы статистики начали оперировать показателем «посетители». Для этого используются файлы cookie.

Файлы cookie – это небольшой фрагмент данных, созданный веб-сервером и хранимый на компьютере пользователя в виде файла, с помощью которого сервер идентифицирует конкретного пользователя и хранит определенную информацию о нем.

Однако определенное количество пользователей запрещают своим браузерам принимать cookie на жесткий диск. Кроме того, время от времени файлы cookie, даже попавшие на компьютер, сознательно стираются пользователями или теряются в силу различных причин.

После некоторого периода времени счетчик сам уничтожает данные о пользователе, после чего он, при повторном заходе на сайт, будет считаться новым посетителем. Так что, хотя показатель «посетители» более точен, чем параметр «хосты», всецело доверять ему также нельзя.

Сессии. Один пользователь может просматривать несколько страниц одного сайта подряд. Процесс такого просмотра и называется сессией. Возможно, что, покинув сайт, через некоторое время пользователь вновь захочет просмотреть какие-то его страницы, т.е. провести следующую сессию.

Начало каждой сессии можно определить точно, а вот конец — нет. Ведь посетитель может, не уходя с сайта, заняться просмотром почты или какой-либо другой работой на компьютере. Поэтому параметр длительности сессии определить с высокой точностью невозможно.
В связи с этим, если посетитель долгое время не переходит с одной страницы сайта на другие, сессия считается законченной. Продолжительность этого периода разные счетчики определяют по-разному.

Чаще всего это 15 минут – время, вполне достаточное для просмотра одной страницы сайта. Если спустя, например, 20 минут пользователь все же открывает очередную страницу сайта, этот момент считается началом новой сессии.

Следует отметить, что некоторые счетчики один показ (хит) не засчитывают как сессию. Другие засчитывают, но если показа второй страницы в течение заданного промежутка времени не последовало, длительность такой сессии принимается равной нулю.

Хиты. Хиты – это общее количество просмотров всех страниц сайта. Сам по себе данный показатель достаточно малоинформативен.
Он может быть легко «раздут» владельцем сайта, — например, за счет размещения на сайте форума.
Недобросовестные владельцы сайтов могут воспользоваться услугами робота, непрерывно перезагружающего страницы. Но без показателя «хиты» невозможно оценить другой важный показатель – «глубина просмотра».

Глубина просмотра. Если разделить количество хитов на количество хостов или посетителей, то получим показатель «глубина просмотра». Фактически по этому показателю можно судить о том, сколько страниц в среднем просматривает посетитель.
Если данный параметр близок к 1, значит, у сайта есть проблемы. Посетители покидают сайт, просмотрев только одну страницу.
Причины могут быть разные:

  • неинтересное для большинства пользователей содержимое сайта;
  • неприятный дизайн сайта (слишком мелкий шрифт, неудачное сочетание цветов и т.д.);
  • плохая система навигации (отсутствие на каждой странице ссылок на другие разделы сайта и другие недоработки, создающие неудобства для посетителей).

Приемлемый показатель «глубина просмотра» – не менее трех. Это говорит о том, что посетителям интересен ресурс. Ознакомившись с одной страницей, они просматривают и другие.

Однако следует отметить, что рассмотренные выше показатели, характеризующие посещаемость и глубину просмотра сайта, в большей степени подходят для анализа сайтов общей направленности — порталов, каталогов, электронных библиотек, почтовых сервисов и сайтов СМИ. Для таких сайтов чем выше посещаемость и глубина просмотра, тем лучше, тем успешнее проект. Для специализированных сайтов данные показатели не могут считаться однозначными критериями успешности. Но в любом случае для любых сайтов важно знать какова аудитория сайта.

В Рунете свои счетчики предлагают как известные крупные ресурсы (Яндекс.Метрика, Google Analytics, Rambler’s Top100, счетчик Liveinternet.ru и др.), так и специализированные сервисы (Hotlog.ru, spylog.ru, 24log.ru, GoStat.ru, Topstat.ru и др.).

Результаты измерений различных счетчиков могут достаточно сильно отличаться, однако это не говорит о том, что одни счетчики точные, а другие – нет, просто их создатели имеют разный подход к сбору статистической информации.