Am 04.11.14 09:26, schrieb Johannes C. Schulz - EnzephaloN IT-Solutions:

Der zweite Eintrag ist redundant – ja. Funktionieren tut es aber nicht. Der
Googlebot generiert fleißig weiter PDFs (wir haben auf fast jeder Seite im
Fuß einen Link, um die Seite als PDF zu speichern).
>
Wie kann ich nun den Googlebot (und alle anderen Bots) davon abbringen die
PDFs zu generieren??

wie wäre es den Link für google unsichtbar zu machen?
bzw. konkreter: nur für nicht google-Zugriffe sichtbar zu machen:
macht keine a-Tags mit direktem href auf die PDFs, sondern macht ein Javascript, das die hrefs erst beim Anzeigen einsetzt [1], oder dass der Link erst mit dem Klick selber generiert wird [2]


[1] $('.pdf-link').foreach(function() {
$(this).attr('href',$(this).attr('data-pdf-link'));
}
(ich hoffe mein jquery wissen ist noch aktuell :/ )

[2] onClick="window.location='pdf-link'; return false"

zusätzlich könntet ihr natürlich noch einen IP-based Filter für die PDFs einsetzen, der den Google Bot für die PDFs auf eine leere Seite oder ein 404 lenkt. Oder die Seite für Diese IPs ohne den PDF-Link generieren?

Das hilft natürlich nichts gegen andere Bots, bis ihr deren IP in den Filter aufnehmt.


bernd
--
http://www.pi-phi.de/cheatsheet.html
_______________________________________________
TYPO3-german mailing list
TYPO3-german@lists.typo3.org
http://lists.typo3.org/cgi-bin/mailman/listinfo/typo3-german

Antwort per Email an