PHP : User-Agent : être honnête (ou pas) avec les sites “visités”
PHP permet d’utiliser des documents accessibles par HTTP/HTTPS comme s’il s’agissait de fichiers locaux. Plus exactement, PHP possède un “wrapper” (gestionnaire) pour ces protocoles.
Ceci dit, lorsque vous accédez à des documents qui ne sont pas sur votre site, une politesse élémentaire (en plus d’y aller modérément avec les ressources du serveur visité et de respecter tout fichier robots.txt) est de donner au site visité un user-agent descriptif et honnête. (Et si vous voulez masquer/fausser la valeur autant le faire proprement…)
Cette indication (le “User-Agent“) indique au serveur visité le navigateur utilisé, ou le programme, bot ou service qui visite son site.
Vous pouvez régler la valeur donnée en tant qu’ User-Agent via le php.ini (si vous y avez accès) ou autrement via la fonction “ini_set()”:
Exemple:
ini_set('user_agent',"Stupid Fake Feed Parser (+http://xn--tre_stupide-mbb.saimal.fr/) Allow like Mozilla/5.0 (en-GB) Gecko Firefox/3.0.1");
Il est préférable de toujours donner une valeur par défaut via ini_set dans les programmes php que vous créez, afin d’évitez des mauvais réglages éventuels dans le php.ini. (Par “mauvais” j’entends tout simplement réglages inadaptés à une utilisation qui n’est pas forcément prévisible par les hébergeurs…)
Par exemple, il semblerait que la configuration par défaut du 90plan d’ovh ne renvoie pas d’User-Agent si vous n’en indiquez pas un explicitement (et certains sites peuvent “ne pas apprécier” si vous n’en donnez pas un).
