Méthode couteuse: les requêtes ici sont des GET mais ça récupère tout (même
si tu filtres ensuite par un head -n 1). Un HEAD serait plus approprié
(pour ne récupérer d'abord que les entêtes et pas les pages entières) :
c'est suffisant pour obtenir un statut 404.

Note: certains sites retournent une page 200 même quand l'URL est invalide
(un "wildcard" récupère ce qui n'est pas trouvé et affiche une autre page):
pratique courante sur les sites commerciaux qui veulent afficher mlalgré
tout leur portail et font à l aplace des recherches plus ou moins liées aux
termes demandés dans la requête, ce qui n'est pas toujours en grand rapport
avec ce qu'on cherchait. Idem pour les sites hébergeurs de blogues ou
"pages perso" des FAI: une URL disparait, l'herbergeur affiche autre chose,
comme il lui plait...

Le 20 janvier 2017 à 20:34, <osm.sanspourr...@spamgourmet.com> a écrit :

> Le plus simple c'est sans doute de demander à curl depuis un overpass
> turbo pour récupérer les url :
>
> curl -L -I http://www.example.org 2>/dev/null | head -n 1 | cut -d$' ' -f2.
>
>
> rend 200 et
> curl -L -I http://www.example.org/pageAbsente 2>/dev/null | head -n 1 |
> cut -d$' ' -f2.
> rend 404.
>
> Le test Keep-right  semble rechercher s'il y a le nom de l'objet dans la
> page au prétexte que l'url doit être spécifique.
> Un peu tordu et sans doute facile à faire taire (ajouter un #ParnasseNoura
> par exemple).
> Si on peut déclarer faux positif, pourquoi pas.
>
> Mais ce n'est clairement pas ce que tu cherches.
> Jean-Yvon
>
>
> Le 20/01/2017 à 11:54, Florian LAINEZ - winner...@free.fr a écrit :
>
> Fred, j'ai testé Keep-right et j'ai été très déçu. L'outil fait des
> contrôles sur les URLs mais je ne comprends pas le fonctionnement. Et puis,
> ce que je cherche, c'est un outil qui fasse une requête pour trouver des
> 404.
>
> Exemple d'erreur que je ne comprends pas sur le node
> http://www.openstreetmap.org/node/1427978197 :
> Content of the URL (http://www.mk2.com/salle/parnasse) did not contain
> these keywords: (Mk2Parnasse;Noura✔Parnasse;Noura✔ParnasseNoura)
>
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à