Informatieoorlogvoering - Informatieoorlogvoering | Draven's verhalen uit de crypte

De AI van Facebook kan memes analyseren, maar kan het ze ook begrijpen? De Rosetta-technologie van Facebook analyseert miljarden afbeeldingen die tekst bevatten, maar memes zijn te complex voor kunstmatige intelligentie. Elke dag worden er miljarden teksten, foto’s en video’s geüpload naar sociale media. Dit is een schat aan informatie die menselijke moderators en hun factcheckers niet volledig kunnen doorzoeken, controleren en controleren. Bedrijven als Facebook en YouTube vertrouwen al lang op kunstmatige intelligentie om spam, geweld, kritische inhoud en pornografie van hun platforms te houden!

Zoiets als een systeemkritische meme zonder tekst kan voor de supercomputers en hun algoritmen moeilijk te analyseren en te verwerken zijn, omdat deze taak het tegelijkertijd berekenen van verschillende visuele elementen vereist. Geautomatiseerde systemen, zogenaamde botsystemen, moeten de woorden boven de foto herkennen en ‘lezen’, maar ook de afbeelding zelf analyseren en toewijzen. Memes kunnen ook worden omschreven als ingewikkelde culturele artefacten die buiten de context moeilijk te begrijpen zijn. Ondanks de uitdagingen die ze met zich meebrengen, gebruiken alle grote sociale platforms al AI om memes te controleren, waaronder Facebook, dat een tool genaamd Rosetta gebruikt om foto's en video's te analyseren die tekst en bijschriften bevatten.

Volgens Facebook wordt Rosetta al gebruikt om automatisch inhoud te detecteren die de richtlijnen voor haatzaaien schendt. Met de hulp van Rosetta streeft Facebook ernaar gebruikersinhoud te controleren, inclusief foto's en video's, en niet alleen op tekst gebaseerde berichten. Rosetta ondersteunt het proces waarbij automatisch wordt gecontroleerd of afbeeldingen en video’s die tekst bevatten eerder als ‘kritiek’ zijn gemarkeerd. Rosetta combineert OCR-technologie (optische karakterherkenning) met andere machine learning-technieken om tekst in en op foto's en video's te bekijken, verwerken, classificeren, toewijzen en vervolgens op te slaan. Ten eerste wordt OCR gebruikt om te bepalen waar de tekst zich in een meme of video bevindt. Hierdoor kunnen ze gegevens snel transformeren en hun ‘selectors’ gebruiken om de inhoud te evalueren.

Zodra Rosetta weet waar de woorden staan, gebruikt Facebook een neuraal netwerk dat de tekst, de transcriptie en de betekenis ervan kan begrijpen. Deze tekst kan vervolgens via andere systemen worden doorgegeven, zoals een systeem dat controleert of de meme een virale boodschap is die volgens hun richtlijnen al is ontkracht. De ontwikkelaars en onderzoekers van Rosetta beweren dat de tool nu in realtime tekst kan extraheren uit elke afbeelding die publiekelijk naar Facebook is geüpload en de tekst kan herkennen, en de taalidentificatie kan "lezen", waaronder Engels, Spaans, Duits en Arabisch.

Rosetta kan ook afbeeldingen analyseren die tekst in veel verschillende vormen bevatten, zoals foto's van protestborden, restaurantmenu's, etalages en meer. Viswanath Sivakumar, een software-ingenieur bij Facebook die aan Rosetta werkt, zei in een e-mail dat de tool goed werkt voor zowel het identificeren van tekst in een landschap als een straatnaambord als voor memes - maar dat laatste is een grotere uitdaging. “In de context van het proactief detecteren van haatzaaiende uitlatingen en andere inhoud die het beleid schendt, presenteren meme-achtige beelden de complexere AI-uitdaging”, schreef hij.

In tegenstelling tot mensen moet een AI doorgaans tienduizenden voorbeelden zien voordat hij een ingewikkelde taak kan leren voltooien, zegt Sivakumar. Maar memes zijn niet oneindig controleerbaar, zelfs niet voor Facebook, en het verzamelen en opslaan van voldoende voorbeelden in verschillende talen en emoties kan ook moeilijk blijken te zijn. Het vinden van berichten van hoge kwaliteit is een voortdurende uitdaging voor onderzoek naar kunstmatige intelligentie in bredere zin. Gegevens moeten vaak zorgvuldig handmatig worden gelabeld en gearchiveerd. Veel databanken zijn ook auteursrechtelijk beschermd.

Om Rosetta te voorzien van de nodige gegevens en het nut ervan te trainen, wordt de tekst, samen met de bijschriften en de locaties van waaruit ze zijn gepubliceerd, gecombineerd tot een computerproces. In gewone woorden: je hebt een programma gemaakt om precies die voorbeelden te maken waarvan de inhoud twijfelachtig lijkt. Dit betekent dat het hele proces tot op zekere hoogte geautomatiseerd is: het ene programma spuugt automatisch de memes uit en een ander probeert ze te analyseren. AI zal met zeer grote uitdagingen worden geconfronteerd. Zo wordt Rosetta geconfronteerd met talen als het Arabisch, dat van rechts naar links wordt gelezen, in tegenstelling tot andere talen zoals Engels of Duits. Rosetta ‘leest’ het Arabisch achterstevoren, waarna Facebook de tekens na verwerking omdraait. Deze truc werkt verrassend goed en zorgt voor een uniform model dat zowel voor talen van links naar rechts als voor talen van rechts naar links werkt.

Geautomatiseerde systemen kunnen uiterst nuttig zijn voor het modereren van inhoud en het controleren van feiten, maar ze zijn niet altijd gemakkelijk. WeChat gebruikt bijvoorbeeld twee verschillende algoritmen om afbeeldingen te filteren. Het eerste, een op OCR gebaseerd programma, filtert foto's die tekst over verboden onderwerpen bevatten, terwijl de andere afbeeldingen censureren die lijken op die op een zwarte lijst die waarschijnlijk door de Chinese overheid is opgesteld. Via de filters van WeChat kunt u eenvoudig de kenmerken van een afbeelding verwijderen, evenals de kleur of gewijzigde oriëntatie. Facebook's Rossetta is complex, maar waarschijnlijk niet perfect. Het systeem kan worden omzeild door moeilijk leesbare tekst of vervormde lettertypen. Alle algoritmen voor beeldherkenning zijn ook nog steeds potentieel kwetsbaar voor tegenstrijdige voorbeelden, licht gewijzigde beelden die er voor mensen hetzelfde uitzien, maar ervoor zorgen dat een AI in de war raakt.

Facebook en andere platforms zoals Twitter, YouTube en Reddit staan onder enorme druk om in verschillende landen toezicht te houden op bepaalde soorten inhoud. In 2018 heeft de Europese Unie nieuwe wetten voorgesteld die sociale-mediabedrijven verplichten terroristische berichten binnen een uur na kennisgeving te verwijderen, anders riskeren ze boetes. Rosetta en andere vergelijkbare geautomatiseerde tools helpen Facebook en andere platforms al om te voldoen aan soortgelijke wetten in landen als Duitsland. En ze worden steeds beter in hun werk: twee jaar geleden zei CEO Mark Zuckerberg dat de AI-systemen van Facebook slechts proactief ongeveer de helft van de inhoud onderscheppen die het bedrijf verwijderde. Mensen moeten de rest eerst markeren. Volgens Facebook detecteren de AI-tools bijna 100 procent van de spam die zij veroordelen, evenals 99,5 procent van de terroristische inhoud en 86 procent van het expliciete geweld. Andere platforms zoals YouTube hebben vergelijkbaar succes geboekt met geautomatiseerde systemen voor inhoudherkenning.

Dit betekent echter niet dat AI-systemen zoals Rosetta een perfecte oplossing zijn, vooral als het gaat om meer genuanceerde uitingsvormen. In tegenstelling tot een restaurantmenu kan het moeilijk zijn om de betekenis van een meme te analyseren zonder de context te kennen waarin deze is gepost. Daarom zijn er hele websites die ze uitleggen. Memes bevatten vaak inside jokes of zijn zeer specifiek voor een bepaalde online subcultuur en de morele en ethische achtergrond ervan. En kunstmatige intelligentie is nog steeds niet in staat een meme of video te begrijpen zoals iemand dat zou doen. Voorlopig zal Facebook nog steeds moeten vertrouwen op menselijke moderators en hun factcheckers om beslissingen te nemen over het al dan niet verwijderen van een meme.

Vertaalartikel uit het tijdschrift Wired van 14.09.2018 september XNUMX

(via Vale Rion)

"Dravens Tales from the Crypt" betovert al meer dan 15 jaar met een smakeloze mix van humor, serieuze journalistiek - voor actualiteit en onevenwichtige berichtgeving in de perspolitiek - en zombies, gegarneerd met veel kunst, entertainment en punkrock. Draven heeft van zijn hobby een populair merk gemaakt dat niet in een hokje te plaatsen is.

Mijn blog is nooit ontworpen om nieuws te verspreiden, laat staan om politiek te worden, maar met de actualiteit kan ik het niet laten hier informatie vast te leggen die anders op alle andere kanalen wordt gecensureerd. Ik ben me ervan bewust dat de ontwerppagina voor velen in dit opzicht misschien niet "serieus" lijkt, maar ik zal dit niet veranderen om de "mainstream" tevreden te stellen. Wie openstaat voor niet-statelijke informatie, ziet de inhoud en niet de verpakking. Ik heb de afgelopen 2 jaar genoeg geprobeerd mensen van informatie te voorzien, maar merkte al snel dat het nooit uitmaakt hoe het "verpakt" is, maar wat de houding van de ander er tegenover is. Ik wil niemand honing op de mond smeren om op welke manier dan ook aan de verwachtingen te voldoen, dus ik zal dit ontwerp behouden omdat ik hopelijk op een gegeven moment kan stoppen met het maken van deze politieke uitspraken, want het is niet mijn doel om door te gaan zoals dit voor altijd Ik laat het aan iedereen over hoe ze ermee omgaan. U bent echter van harte welkom om de inhoud eenvoudig te kopiëren en te verspreiden, mijn blog is altijd onder de WTFPL-licentie.

Het is moeilijk voor mij om te beschrijven wat ik hier eigenlijk doe, DravensTales is in de loop der jaren een cultuurblog, muziekblog, shockblog, techblog, horrorblog, leuk blog, een blog over gevonden voorwerpen op internet, internet bizar, trash blog, kunstblog, boiler, tijdgeestblog geworden , Scrap blog en grabbel blog genaamd. Alles wat klopt ... - en toch niet. De belangrijkste focus van de blog is hedendaagse kunst, in de breedste zin van het woord.

Om de werking van de site te garanderen, bent u van harte welkom Doe een donatie via creditcard, Paypal, Google Pay, Apple Pay of automatische incasso/bankrekening. Veel dank aan alle lezers en supporters van deze blog!