METAstasiVERSO vs POLIVERSO: ecco come l’informazione italiana ha ignorato il più grande sversamento di rifiuti compiuto da Facebook nel Web

Ecco come un problema che abbiamo riscontrato sul nostro server Poliverso.org ci ha fatto accorgere dell’invasione dei crawler che Meta sta sguinzagliando per il Web con l’obittivo di addestrare la sua intelligenza artificiale. E i media italiani, muti!

@informatica

https://www.informapirata.it/2024/10/10/metastasiverso-vs-poliverso-ecco-come-linformazione-italiana-ha-ignorato-il-piu-grande-sversamento-di-rifiuti-compiuto-da-facebook-nel-web/

1 point

Grazie per l’info, molto utile! Su Wordpress utilizzo da un po’ di tempo un piccolo (e forse abbastanza sconosciuto) plugin che intercetta i crawler di varie IA (incluso ad es Gemini di Google). Provo a controllare se avevano già incluso quello di Meta in blacklist.

permalink
report
reply

@damtux grazie per la dritta. Come si chiama questo plugin?

permalink
report
parent
reply
1 point

si chiama Simple NoAI & NoImageAI https://it.wordpress.org/plugins/simple-noai-and-noimageai/

Però ce ne sono altri che forse possono aiutare di più, come gli honeypot…ovvero tutta la categoria di plugin che creano trappole per attirare bot e crawler non desiderati e deviarli dal loro vero scopo.

permalink
report
parent
reply
1 point

@damtux @informapirata Quante parole americane hai usato?
Un, due, tre, via…

permalink
report
parent
reply
1 point
Deleted by creator
permalink
report
reply

@comandante_virgola in realtà basterebbe un whistleblower, un magistrato e un paio di politici nella commissione giusta

@informatica

permalink
report
parent
reply
1 point

@informapirata @comandante_virgola @informatica anche se non ho mai gestito dei siti, ho letto che i siti possono rifiutare questi crawler

permalink
report
parent
reply

@tommaso_telesca si può delegare a un provider (per es. Cloudflare) o aggiornare continuamente il file robots.txt e monitorare eventuali bypass. Insomma, centralizzazione o scassamento di ⚾⚾

@comandante_virgola @informatica

permalink
report
parent
reply
1 point
Deleted by creator
permalink
report
parent
reply
0 points

@informapirata @informatica ah ecco, allora friendica era innocente!

permalink
report
reply

@luca @informatica probabilmente sì, anche se durante i test che avevamo fatto con l’app, C’erano stati sovraccarichi dovuti ad alcune chiamate che l’App faceva sul sistema. Ma il problema era soprattutto questo continuo bombardamento da parte dei crawler di Facebook… 🤬

permalink
report
parent
reply

Informatica (Italy e non Italy 😁)

!informatica@feddit.it

Create post

Ecco finalmente la comunità italiana Lemmy dedicata all’informatica!

Questo è il luogo in cui condividere post sul mondo dell’informatica: notizie su hardware e software, cybersecurity, cyberwarfare, hacking, nuovi prodotti, data breach!

Ricordiamo che esistono anche alcune comunità che si occupano di argomenti più specifici, quali:

Regole della comunità:

🏳️‍🌈 chiediamo educazione e rispetto per gli altri

🎃 anche se ci chiamiamo “Informatica” non banniamo gli utenti a caso 😁

🚫 trolling, shitposting e molestie sono vietati

💲 è vietato superare il confine che separa l’informazione dalla pubblicità

🔊 evitiamo il clickbait e il sensazionalismo

📖 per il resto valgono le regole dell’istanza al link https://feddit.it/post/6

Community stats

  • 92

    Monthly active users

  • 529

    Posts

  • 391

    Comments