METAstasiVERSO vs POLIVERSO: ecco come l’informazione italiana ha ignorato il più grande sversamento di rifiuti compiuto da Facebook nel Web
Ecco come un problema che abbiamo riscontrato sul nostro server Poliverso.org ci ha fatto accorgere dell’invasione dei crawler che Meta sta sguinzagliando per il Web con l’obittivo di addestrare la sua intelligenza artificiale. E i media italiani, muti!
Grazie per l’info, molto utile! Su Wordpress utilizzo da un po’ di tempo un piccolo (e forse abbastanza sconosciuto) plugin che intercetta i crawler di varie IA (incluso ad es Gemini di Google). Provo a controllare se avevano già incluso quello di Meta in blacklist.
si chiama Simple NoAI & NoImageAI https://it.wordpress.org/plugins/simple-noai-and-noimageai/
Però ce ne sono altri che forse possono aiutare di più, come gli honeypot…ovvero tutta la categoria di plugin che creano trappole per attirare bot e crawler non desiderati e deviarli dal loro vero scopo.
@damtux @informapirata Quante parole americane hai usato?
Un, due, tre, via…
@comandante_virgola in realtà basterebbe un whistleblower, un magistrato e un paio di politici nella commissione giusta
@informapirata @comandante_virgola @informatica anche se non ho mai gestito dei siti, ho letto che i siti possono rifiutare questi crawler
@tommaso_telesca si può delegare a un provider (per es. Cloudflare) o aggiornare continuamente il file robots.txt e monitorare eventuali bypass. Insomma, centralizzazione o scassamento di ⚾⚾
@informapirata @informatica ah ecco, allora friendica era innocente!
@luca @informatica probabilmente sì, anche se durante i test che avevamo fatto con l’app, C’erano stati sovraccarichi dovuti ad alcune chiamate che l’App faceva sul sistema. Ma il problema era soprattutto questo continuo bombardamento da parte dei crawler di Facebook… 🤬