О правильной структуре сайта.

Это статья о корректной структуре сайта, без которой невозможно сколько-нибудь удачно представить его в поисковых системах. Что очень важно в современном мире.
Структура будет представлена в иерархическом виде с короткими пояснениями, не претендующими на всеобемлющее SEO-продвижение.

  • Сайт имеет иерархическую структуру, которая представлена ниже:
    • Домен — характерное название сайта. Необходимо выбрать основное зеркало с WWW или без него здесь и здесь , можно указать регистр домена.
    • Протокол - HTTP или HTTPS, по которому сайт отдается. На данный момент предпочтительнее HTTPS, рекомендации здесь .
    • файл robots.txt - указывается, как поисковые системы должны просматривать и индексировать сайт.
    • файл sitemap.xml - указывается иерархическая структура страниц сайта, представленных их уникальными адресами (URL).
    • Коллекция страниц сайта - логичная иерархия страниц может повлиять на индексацию и поисковое ранжирование.
      Каждая страница должна иметь следующую структуру:
      • URL страницы — уникальный адрес страницы. Существуют приоритетные правила формирования, которые могут повлиять на ранжирование страниц в поисковой выдаче.
      • Правильный статус ответа в http заголовках - 200, 301, 404 и так далее.
      • Элемент DOCTYPE - предпочтителен тип, соответствующий html 5.
      • Элемент html - контейнер для контента страницы.
        • Элемент head.
          • Элемент title — заголовок страницы, отображающийся в специальном окне браузера. Каждая страница должна иметь уникальное содержание со строго ограниченным количеством символов.
          • Коллекция элементов meta со специфическими атрибутами name, content, http-equiv. На каждой странице значения должны быть конкретными - в соответствии с ее содержанием. Например:
            • name="description" content="Описание страницы - уникальное, со строго ограниченным количеством символов".
            • name="copyright" content="yourdomain.com".
            • name="author" content="yourdomain.com".
            • name="robots" content="index|noindex, follow|nofollow".
            • http-equiv="Content-Type" content="text/html; charset=utf-8".
            • http-equiv="X-UA-Compatible" content="IE=edge,chrome=1".
            • http-equiv="imagetoolbar" content="true|false".
          • Коллекция элементов link со специфическими атрибутами rel, href, title, media, hreflang, type. На каждой странице значения должны быть конкретными - в соответствии с ее содержанием. Например:
            • rel="sitemap" href="URL к файлу sitemap.xml" title="application/xml".
            • rel="shortcut icon" href="URL к файлу favicon.ico".
            • rel="apple-touch-icon" href="URL к файлу logo.png".
            • rel="canonical" href="URL к канонической странице".
            • rel="alternate" href="URL к альтернативной странице, например к мобильной версии" media="only screen and (max-width: 640px)" hreflang="ru".
            • rel="prev" href="для страниц с пагинацией - URL к предыдущей".
            • rel="next" href="для страниц с пагинацией - URL к следующей".
            • rel="stylesheet" type="text/css" href="URL к файлу .css".
              В коде файлов .css не должно быть ошибок, файлы необходимо по возможности склеить в один и оптимизировать (инструмент YUI Compressor можно взять здесь ). При отдаче файлы желательно сжать возможностями веб-сервера и указать в http-заголовке корректный Expires.
          • Коллекция элементов script, например:
            • type="text/javascript" src="URL к файлу .js".
              В коде файлов .js не должно быть ошибок, файлы необходимо по возможности склеить в один и оптимизировать (инструмент Closure Compiler application можно взять здесь ). При отдаче файлы желательно сжать возможностями веб-сервера и указать в http-заголовке корректный Expires.
        • Элемент body:
          • Коллекция элементов заголовков h1...h6. Элемент h1 должен быть один на страницу и как можно ближе к ее началу.
          • Коллекция элементов a с обязательным атрибутом title и релевантным анкором (текстом ссылки).
            Ссылки на другие ресурсы сайта не должны адресовать страницы, которые отдают 403 или 404.
            Cсылки на другие ресурсы более высокого ранга (fb, vk, twitter) должны быть обрамлены тегами noindex.
          • Коллекция элементов img с обязательным атрибутом alt.
            Файлы (jpg, jpeg, png, gif) должны быть оптимизированы в соответствии с этими рекомендациями
          • Текстовое содержание может располагаться в различных html-элементах, основной текст должен находиться как можно ближе к началу страницы (возможен перенос контента при помощи css вниз страницы, если эта информация не так важна пользователю).
            Именно по текстовому содержанию поисковые системы определяют семантику страницы. Они учитывают морфологию лексем и синтаксис словосочетаний и предложений.
            Меняйте текстовое содержание время от времени - динамика изменения страницы "не забывается" поисковыми системами и положительно влияет на ее ранг.
            При составлении текстов избегайте дублирования содержания на различных страницах. Поисковые системы корректно определяют общий для нескольких страниц контент (меню, навигация), но "не любят" повторов в семантически значимом содержании.
            Поисковые системы определяют семантику по лексемам и грамматической структуре текста. Грамматика русского языка, как языка синтетического, отличается от грамматики английского, аналитического языка. Поэтому при составлении текстов для российских поисковых систем делайте упор на словоформы. Для англоязычных поисковых систем начните с характерного синтаксиса изъявительного наклонения.
          • Микроразметка все более настойчиво вторгается в семантику страниц, на которых представлены товары и услуги.
            Приведите структуру страниц в соответствии с рекомендациями по формированию микроразметки для ваших товаров и услуг.
Реализация приведенной выше структуры гарантировано избавит сайт от ошибок, которые формально снижают ранг сайта и его страниц в выдаче поисковых систем.

05.01.2016