Создание sitemap.xml
Sitemap – это карта сайта. В основном она нужна для поисковых ботов, чтобы они могли зайти по адресу
site.ru/sitemap.xml
и увидели все ссылки на все ресурсы, которые есть на вашем сайте. Например, если у
вас 100 страниц, то в sitemap также будет отображено 100 страниц. Формат данных представлен в виде
XML (eXtensible Markup Language) структуры.
Также на некоторых веб ресурсах Вы можете встретить страницы вида site.ru/sitemap.html
. Такие страницы
делаются для оптимизации ссылочных масс. Здесь отображают основные страницы вашего сайта, а также ставят ссылки на
партнеров ресурса. Таким образом вы делитесь своим «весом» с другими сайтами сети, тем самым продвигая друг друга.
В случае отсутствия sitemap на сайте, поисковым роботам будет очень трудно найти все страницы вашего веб ресурса, как следствие ваши страницы будут медленнее появляться в поисковой выдаче.
Sitemap на ModX создается очень просто. В прошлой статье про установку плагинов мы
поставили расширение под название pdoTools
, которое нам пригодится:
-
Во вкладке ресурсы нажимаем на «+» и создаем новую страницу
-
Во вкладке «Документ» в заголовок пишем «Sitemap»
-
Во вкладке «Настройки» убираем галочку
«Использовать HTML редактор»
а тип содержимого выставляем «XML» -
В самом содержимом пишем простую инструкцию
[[!pdoSitemap]]
- Сохраняем и можем перейти в ресурс и убедиться в правильности отображения контента.
Создание robots.txt
Robots.txt – это текстовый файл, который обычно находится в корне сайта и доступен по адресу:
site.ru/robots.txt
. Данный файл нужен поисковым роботам, чтобы они могли проанализировать сайт и узнать
какие ресурсы им можно и нужно индексировать, а какие трогать нельзя. Также в этом файле указывается ссылка на хост
вашего сайта и ссылка на карту, т.к. robots.txt – это первая страница, куда попадет бот на вашем
сайте.
Robots.txt также создается в ModX несложно:
-
Переходим во вкладку «Элементы» и создаем новый сниппет нажатием на
«+»
. -
Называем сниппет «host» а в код сниппета вставляем следующее:
<?php echo $_SERVER['HTTP_HOST'];
-
После сохранения сниппета переходим обратно в ресурсы и нажатием на
«+»
(создать новый ресурс). -
Обзываем его robots. Во вкладке настройки также снимаем галку с
«Использовать HTML редактор»
, а тип содержимого выбираем text. -
В код содержимого вставляем следующие строчки:
User-agent: * Disallow: /core/ Disallow: /manager/ Disallow: /connectors/ Disallow: /index.php Disallow: /index.html Host: https://[[host]] Sitemap: https://[[host]]/sitemap.xml
-
Сохраняем ресурс и можем проверять его, перейдя по
site.ru/robots.txt
Как видно из кода, в последней строчке мы указываем [[host]]
, что вызовет наш сниппет
host и вернет текущее имя хоста, например localhost или site.ru.
No-html ресурсы
Многие страницы в интернете выглядят так: site.ru/ochen-interesnaya-statia.html
. Как видно из ссылки
включены дружественные URL, которые транслитерируют текст (как включить дружественные URL читайте в этой
статье), но в конце все портит «.html
». В modx очень просто отключить отображение расширения, чтобы
ссылки на ваши ресурсы были красивыми и приятными.
П.с. данную процедуру можно также выполнить через .htaccess
, но мы рассмотрим встроенные
в движок метод.
-
Во вкладке вверху выбираем Содержимое → Типы содержимого.
-
Создаем «Новый тип содержимого» по кнопке и с ПКМ по «HTML» выбираем
«Редактировать тип содержимого».
-
У вас получится 2 открытых окна и из типа HTML копируем все, кроме «Названия» и
«Расширения файла». Расширение оставляем пустым, а в названии вписываем, например,
no-HTML
. -
Теперь в настройках нам нужно сделать так, чтобы данный тип содержимого автоматически присваивался каждому
созданному ресурсу. Для этого переходим в Шестеренку → Системные настройки.
-
В фильтрах выставляем Core → Сайт и находи пункт «
default_content_type
». Кликаем 2 раза и выбираем вновь созданный тип содержимого