andronof/robotstxt
Composer 安装命令:
composer require andronof/robotstxt
包简介
Parse robots.txt
README 文档
README
Библиотека для разбора файла robots.txt. Написаная на языке php. Основная задча библиотеки проверить любую ссылку, закрыта она от индексации или нет. Правила разбора используются из описания в справочнике Яндекс.
Правила разбора
- Разбирается все данные по ботам.
- Для каждого бота сортируются по длине ссылки. Если у нескольких правил длина одинаковая то предпочтение отдается разрешающему(allow) правилу.
- Правила содержащие пустые значения изменяются на противоположные.
Установка
Через composer:
{
"require": {
"andronof/robotstxt": "dev-master"
}
}
и запустить команду
composer update
установится последний версия, но не обязательно стабильная или
composer require andronof/robotstxt
установится последняя стабильная версия
Использование
$robotstxt = new \Robotstxt(file_get_contents('http://yandex.ru/robots.txt'));
или
$robotstxt = new \Robotstxt(); $robotstxt->init(file_get_contents('http://yandex.ru/robots.txt'));
Проверка запрещена ли ссылка в robots.txt
if ($robotstxt->isAllowed('/msearch') ) { echo('Доступ разрешен'); } else { echo('Доступ запрещен'); }
Данная функция может принимать вторым параметром имя бота. Если не указан, то берутся правила для всех (*). Ссылку для проверки указывайте с начинающегося слеша (/).
Остальные функции
- isUserAgent($user_agent) — Проверяет есть ли правила для конкретного бота
- setUserAgent($user_agent = null) — Устанавливает правила какого бота использовать. Имеет больший приоритет чем если указывать бота в функции isAllowed. Если необходимо сбросить глобального бота передайте в эту функцию null.
Используется в проектах
统计信息
- 总下载量: 73
- 月度下载量: 0
- 日度下载量: 0
- 收藏数: 1
- 点击次数: 1
- 依赖项目数: 0
- 推荐数: 0
其他信息
- 授权协议: MIT
- 更新时间: 2016-04-29