Статистика сайта по логам веб-сервера

AWStats - анализ логов web-сервера
Интернет
3

Сейчас глобально существует 2 метода сбора статистики о собственном сайте: через скрипт на каждой странице сайта, который отсылает данные поставщику статистики, например, Google Analytics; через анализ лог-файлов сервера, в которые фиксируются все запросы и ответы сервера. Оба способа имеют свои плюсы и минусы, и, несомненно, должны работать параллельно. К сожалению, в последнее время, с развитием Яндекс Метрики и Google Analytics, про анализ логов сервера все забыли (хотя многие хостеры до сих пор по-умолчанию оставляют возможность просмотра такой статистики). Сегодня мы сравним плюсы и минусы этих способов получения данных.

Плюсы и минусы статистики сайта по логам и тегам

По сути, это разница между системами web-аналитики, использующими различные подходы. Например, Google Analytics и AWStats.

В книге Брайана Клифтона “Google Analytics для профессионалов”, таблица “Сравнение методов применения страничных тегов и журнальных файлов” отлично иллюстрирует плюсы и минусы этих систем.

Метод

Преимущества

Недостатки

Страничные теги
(например, Google Analytics, Яндекс Метрика)
Позволяют разграничивать прокси- и кеширующие серверы – обеспечивается более точное отслеживание сеанса. Требуется больше изменений в веб-страницах. Чтобы собирать данные, приходится вносить изменения в страницы веб-сайта.
Отслеживание событий на стороне клиента – например, JavaScript, Flash, Ajax. Ошибки настройки ведут к потере данных. Ошибки в тегах ведут к потере данных без возможности возврата и повторного анализа.
Фиксирование данных электронной торговли на стороне клиента – доступ на стороне сервера бывает проблематичным. Брандмауэры могут исказить или ограничить теги.
Сбор и обработка данных о посетителях почти в реальном времени. Невозможность отслеживания пропускной способности или совершения загрузок – теги выполняются при запросе страницы или файла, а не при завершении загрузки.
Позволяет поставщику проводить обновления программы. Невозможность отслеживания “пауков” поисковых систем – роботы игнорируют теги.
Позволяет поставщику сохранять и архивировать данные.
Программа анализа журнальных файлов
(Например, AWStats, Analog, Webalizer)
Автоматический сбор данных. Никакие изменения веб-страниц не требуются. Погрешности, вызванные применением прокси- и кешириующих серверов. Если страница кешируется, никакая запись не заносится в журнал веб-сервера.
Легкость обработки данных об истории посещенных страниц. Отсутствие отслеживания событий – например, JavaScript, Flash, Ajax.
Отсутствие необходимости беспокоится о проблемах, связанных с брандмауэром. Необходимость выполнения обновления программы собственными силами.
Возможность отслеживания пропускной способности и завершенных загрузок, а также различения полностью и частично завершенных загрузок. Роботы увеличивают количество посещений, и это увеличение может быть значительным.
Выполнение по умолчанию отслеживания “пауков” и роботов поисковых систем.
Выполнение по умолчанию отслеживания посетителей, использующих мобильные устройства с доступом в Интернет.

Системы статистики по логам могут компенсировать проблемы систем статистики на основе страничных тегов (таких, как Google Analytics).

Несомненно, для полной картины происходящего на сайте имеет смысл настроить и использовать обе системы статистики. Важно то, что сравнивать результаты между ними – бессмысленно. Можно лишь сравнивать динамику развития событий в каждой из систем.

Программы статистики по серверным логам

Существуют следующие программы для анализа серверных логов:
AWStats, Piwik, Analog, Webalizer — открытые и Log Parser, Semonitor – лицензируемые, и другие.

Самой популярной, пожалуй, является бесплатная система AWStats. Демо-версию системы можно посмотреть по этому адресу. Система прекрасно справляется с логами Apache, а так же почтовых и ftp серверов.

Интерфейс приложения AWStats выглядит примерно следующим образом:

Screenshot at мая 11 18-00-10

В одном из следующих постов я опишу процесс установки скрипта AWStats на выделенный сервер (конечно, на примере любимого DigitalOcean и ОС Ubuntu).

  • Анастасия

    У меня есть несколько блогов и меня конечно же интересует по ним статистика. Использую я сервис AWStats. Этот сервис самый удобный и именно он предоставляет самую точную статистику в наиболее удобной форме!

  • Гоша

    Статистику стоит изучать в любом случае и если делать это при помощи данного инструмента, то собрать статистику получится максимально быстро и точно. Чем собственно я и пользуюсь.

  • Антон

    Знаете, данный метод проведения анализа мне нравится больше всего. У него намного лучше возможности и для новичка он на мой взгляд намного понятнее, чем другой.

Тренды e-mail маркетинга 2018
Бизнес
6 главных трендов e-mail маркетинга в 2018 году

К чему готовиться Digital специалистам и E-mail маркетологам в 2018 году? С учетом каких тенденций строить план развития E-mail канала? Поделиться «6 главных трендов e-mail маркетинга в 2018 году» FacebookTwitterGoogle+LinkedInVKontakteE-mail Интересное по теме:Домашний сервер — что можно сделать из старого компьютера?Верстка рассылки e-mail одним изображениемМультифон-фантом или пособие неудачникаРассылки купонных сайтов: …

Выявление случаев мошенничества в СРА
Интернет
Анализ трафика CPA партнеров в Google Analytics. Борьба с фродом

Для многих рекламодателей CPA сети, это не только большие возможности, но и большая головная боль. Да, в CPA сетях может быть много «фрода» и некачественного траффика. Но это не значит, что CPA плох сам по себе. Просто, при работе с любым рекламным каналом есть свои нюансы. В CPA, это необходимость …

Web Push уведомления для сайта
Интернет
3
Web Push уведомления для сайта

Вы уже заметили, что в блоге появилась «модная» сегодня функция — подписка на Push уведомления. Для посетителей это еще одна возможность первыми узнавать о появлении новых актуальных статей. Для блогера, это возможность постоянно поддерживать контакт со своей аудиторией. В этой статье мы разберем, что такое Web Push уведомления, как они …

Top