Das Unternehmen Meta, das im Bereich Technik und Künstliche Intelligenz aktiv ist, hat sich zum Ziel gesetzt, die leistungsfähigsten AI-Modelle weltweit zu entwickeln. Um dies zu erreichen, investiert der Konzern nicht nur zweistellige Milliardenbeträge in Rechenzentren und Personal, sondern greift laut einer aktuellen Recherche auch auf Inhalte von Millionen von Websites zurück. Eine durchgesickerte Liste, die Drop Site News vorliegt, umfasst etwa sechs Millionen Domains, die angeblich für Metas KI-Trainingsdaten erfasst wurden, darunter rund 100.000 der meistbesuchten Websites im Internet…❗
Von etablierten Medienmarken wie Getty Images und Shopify bis hin zu Nischenforen, Bildungsportalen und Seiten mit expliziten Inhalten reicht das Spektrum. Der Vorwurf von Drop Site News-Journalisten ist brisant: Metas interner Crawler „Spidermate“ habe absichtlich technische Schutzmaßnahmen wie robots.txt umgangen, die automatisiertes Auslesen eigentlich verhindern sollen. Zwar ist es in den USA unethisch, aber nicht unbedingt verboten. Der Meta-Sprecher Andy Stone reagierte auf Threads mit einer deutlichen Ablehnung und bezeichnete die Liste als „nicht echt“…🤔
GETBLUE GmbH Digitale Lösungen
https://getblue.de/
#getblue #heilbronn #sichtbarkeit #seo #socialmedia #meta #ki #ai

Quelle: Original Facebook Beitrag
