ModX - как сделать Sitemap.xml, robots.txt; как убрать .html расширение у страниц сайта
IT-ModX
31/10/2020

ModX - как сделать Sitemap.xml, robots.txt; как убрать .html расширение у страниц сайта

Реклама

Автор: Камиль Г.

Создание sitemap.xml

Sitemap – это карта сайта. В основном она нужна для поисковых ботов, чтобы они могли зайти по адресу site.ru/sitemap.xml и увидели все ссылки на все ресурсы, которые есть на вашем сайте. Например, если у вас 100 страниц, то в sitemap также будет отображено 100 страниц. Формат данных представлен в виде XML (eXtensible Markup Language) структуры.

Также на некоторых веб-ресурсах Вы можете встретить страницы вида site.ru/sitemap.html. Такие страницы делаются для оптимизации ссылочных масс. Здесь отображают основные страницы вашего сайта, а также ставят ссылки на партнеров ресурса. Таким образом вы делитесь своим «весом» с другими сайтами сети, тем самым продвигая друг друга.

В случае отсутствия sitemap на сайте, поисковым роботам будет очень трудно найти все страницы вашего веб-ресурса, как следствие ваши страницы будут медленнее появляться в поисковой выдаче.

Sitemap на ModX создается очень просто. В прошлой статье про установку плагинов мы поставили расширение под название pdoTools, которое нам пригодится:

  1. Во вкладке ресурсы нажимаем на «+» и создаем новую страницу Modx Revo - вкладка Ресурсы в левом меню
  2. Во вкладке «Документ» в заголовок пишем «Sitemap» Modx Revolution - страница нового ресурса для создания sitemap.xml
  3. Во вкладке «Настройки» убираем галочку «Использовать HTML редактор» а тип содержимого выставляем «XML» Modx Revo sitemap.xml - вкладка настроек ресурса
  4. В самом содержимом пишем простую инструкцию [[!pdoSitemap]] modx revolution sitemap.xml - заполнение сожержимого ресурса
  5. Сохраняем и можем перейти в ресурс и убедиться в правильности отображения контента.

Создание robots.txt

Robots.txt – это текстовый файл, который обычно находится в корне сайта и доступен по адресу: site.ru/robots.txt. Данный файл нужен поисковым роботам, чтобы они могли проанализировать сайт и узнать какие ресурсы им можно и нужно индексировать, а какие трогать нельзя. Также в этом файле указывается ссылка на хост вашего сайта и ссылка на карту, т.к. robots.txt – это первая страница, куда попадет бот на вашем сайте.

Robots.txt также создается в ModX не сложно:

  1. Переходим во вкладку «Элементы» и создаем новый сниппет нажатием на «+». MODX revo robots.txt - вкладка Элементы - блок Сниппеты
  2. Называем сниппет «host» а в код сниппета вставляем следующее:
    <?php
        echo $_SERVER['HTTP_HOST'];
            
    Modx revolution robots.txt - страница создания нового сниппета
  3. После сохранения сниппета переходим обратно в ресурсы и нажатием на «+» создаем новый. ModX revolution robots.txt - создайте новый ресурс во вкладке 'Ресурсы'
  4. Обзываем его robots. Во вкладке настройки также снимаем галку с «Использовать HTML редактор», а тип содержимого выбираем text. ModX Revolution robots.txt - выставляем необходимые настройки ресурса
  5. В код содержимого вставляем следующие строчки:
    User-agent: *
    Disallow: /core/
    Disallow: /manager/
    Disallow: /connectors/
    Disallow: /index.php
    Disallow: /index.html
    Host: https://[[host]]
    Sitemap: https://[[host]]/sitemap.xml
            
  6. Сохраняем ресурс и можем проверять его, перейдя по site.ru/robots.txt

Как видно из кода, в последней строчке мы указываем [[host]], что вызовет наш сниппет host и вернет текущее имя хоста, например localhost

или site.ru.

No-html ресурсы

Многие страницы в интернете выглядят так: site.ru/ochen-interesnaya-statia.html. Как видно из ссылки включены дружественные URL, которые транслитерируют текст (как включить дружественные URL читайте в этой статье), но в конце все портит «.html». В modx очень просто отключить отображение расширения, чтобы ссылки были красивыми и приятными.

П.с. данную процедуру можно также выполнить через .htaccess, но мы рассмотрим встроенные в движок метод.

  1. Во вкладке вверху выбираем Содержимое → Типы содержимого. Modx revo no-html - создаем новый тип сожержимого чтобы убрать расширение .html с URL в браузере
  2. Создаем «Новый тип содержимого» по кнопке и с ПКМ по «HTML» выбираем «Редактировать тип содержимого». modx revolution no-html - создание нового типа содержимого modx revo no-html - заполнение нового типа сожержимого
  3. У вас получится 2 открытых окна и из типа HTML копируем все, кроме «Названия» и «Расширения файла». Расширение оставляем пустым, а в названии вписываем, например, no-HTML. MODX revo no-html - систесные настройки modx
  4. Теперь в настройках нам нужно сделать так, чтобы данный тип содержимого автоматически присваивался каждому созданному ресурсу. Для этого переходим в Шестеренку → Системные настройки. ModX revo no-html - установка нового типа сожержимого по умоляанию
  5. В фильтрах выставляем Core → Сайт и находи пункт «default_content_type». Кликаем 2 раза и выбираем вновь созданный тип содержимого
Вконтакте
Класснуть
Отправить
Вотсапнуть

Реклама