Verzamelen en archiveren (meta)data over bestorming Capitool VS reeds begonnen

Direct na de bestorming van het Capitool in Washington op 6 januari zijn Amerikaanse internetarchivisten, dataonderzoekers en technisch specialisten al aan de slag gegaan om alle data en metadata over de bestorming die online te vinden waren, te verzamelen en te archiveren. De initiatiefnemers willen de gearchiveerde gegevens overdragen aan The Internet Archive en The Library of Congress en bibliothecarissen benaderen om ze breed toegankelijk te maken.

Al tijdens de bestorming van het Capitool op 6 januari begonnen de initiatiefnemers (beeld)materiaal te verzamelen dat online via social media of andere kanalen verspreid werd. Het gaat om talloze foto’s, filmpjes, livestreams, tweets en dergelijke, zowel van de mensen die deelnamen aan de bestorming als van toeschouwers. Veel van dat materiaal is later weer verwijderd, hetzij door de poster zelf, hetzij door de platforms waarop zij het plaatsten. Op Reddit ontstond direct een initiatief om het materiaal te verzamelen. ‘Literally from the moment I heard this was happening I knew I needed to start backing it up. Especially the livestreams and POV of the people breaking into Capitol. I remember from previous protests and riots just how fast websites will remove content,’ aldus initiatiefnemer AdamLynch, volgens Vice in het artikel ‘Archivists Are Preserving Capitol Hill Riot Livestreams Before They’re Deleted’.

De initiatiefnemers willen volgens Vice de gearchiveerde gegevens overdragen aan The Internet Archive en bibliothecarissen benaderen om ze breed toegankelijk te maken. Adam Lynch geeft aan de data uiteindelijk over te willen dragen aan The Library of Congress. Volgens hem gaat het om geschiedenis die bewaard moet blijven. ‘We can only hoard what the world gives us. We’re just librarians,’ aldus Lynch tegenover MIT Technology Review.

Ook andere platforms, zoals search engine en data archive Intelligence X begonnen vrijwel direct met het verzamelen van data.

Ook onderzoekscollectief Bellingcat deed een oproep om direct te beginnen met het verzamelen van social media content over de bestorming, met als bedoeling om alle verzamelde filmpjes en foto’s, samen met materiaal dat op Parler is gepost, te gebruiken ‘to map out, in time and space, the events of the day’. De gearchiveerde en geordende dataset komt later beschikbaar.

Overigens wijst MIT Technology Review er op dat er ook ethische haken en ogen zitten aan het verzamelen en openbaar maken van al de verzamelde data. Het kan aspecten van ‘doxxing’ (het vergaren en eventueel publiceren van (persoonlijke) gegevens van een individu) krijgen, waardoor de foto’s en filmpjes mensen nog jaren kunnen achtervolgen, zelfs als ze later afstand doen van hun daden of gerechtelijke straffen hebben ondergaan.

Toen duidelijk werd dat socialmediaplatforms als Twitter, Facebook en YouTube begonnen met het verwijderen van accounts en controversieel materiaal, verplaatste een groot deel van de posters ervan zich in eerste instantie naar de vaak door extreemrechtse groepen gebruikte sociaalnetwerksite Parler, die enkele dagen later echter in de ban werd gedaan door Amazon, Apple en Google, waardoor het platform ontoegankelijk werd. Ook in het geval van Parler ontstond er een collectieve inspanning om het materiaal te behouden toen het ernaar uitzag dat ook Parler binnen korte tijd uit de lucht zou gaan, met het oog op toekomstig onderzoek naar wat er zich precies heeft afgespeeld op 6 januari. Een beveiligingsonderzoeker, die op Twitter de handle @donk_enby hanteert, nam het initiatief door in samenwerking met het zogeheten Archive Team (een vrijwillig collectief van ethische hackers en data researchers), maar liefst 60 terabyte aan posts te ‘scrapen’ en te bewaren, inclusief bijbehorende metadata aangaande datum, tijd en GPS-gegevens. Het gaat onder andere om vele duizenden filmpjes, foto’s en berichten die tijdens en rond de bestorming van het Amerikaanse Capitool op Parler zijn gepubliceerd. De onderzoeker benadrukt hierbij dat ze alleen posts heeft gearchiveerd die publiekelijk beschikbaar waren. Ook @donk_enby heeft aangegeven de data over te dragen aan The Internet Archive. ProPublica, een nonprofit platform voor onderzoeksjournalistiek, heeft inmiddels op basis van een deel van de gearchiveerde Parler-data een interactieve database gecreëerd via welke video’s chronologisch volgens een tijdlijn gepresenteerd worden.

Toen Trump op 8 januari verbannen werd van zijn belangrijkste podium, Twitter, gingen er overigens direct stemmen op om al zijn tweets, met het oog op de historische relevantie ervan, te bewaren. Ook de US National Archives onderkende het belang hiervan en maakte op 10 januari bekend: ‘[we] will receive, preserve, and provide access to all official Trump Administration social media content, including deleted posts from @realDonaldTrump and @POTUS’. Deze content is (of wordt op een later tijdstip) toegankelijk via de website www.trumplibrary.gov/research/archived-social-media. Er zijn ook initiatieven van andere organisaties en particulieren met als doel Trumps tweets voor toekomstige geschiedschrijvers te archiveren, zoals het Trump Twitter Archive van Brendan Brown en het overzicht ‘Deleted Tweets From Donald J. Trump’ van ProPublica.

Laatste nieuws

Robin Verleisdonk wordt nieuwe directeur-bestuurder Huis73

Oproep om ongelezen werk in te zetten voor GPT-NL

Jeugdbieb organiseert opzoekwedstrijd voor het basisonderwijs

Nieuwe directeur voor Bibliotheek Veldhoven

Verzamelen en archiveren (meta)data over bestorming Capitool VS reeds begonnen

Gerelateerd

Geef een reactie

Robin Verleisdonk wordt nieuwe directeur-bestuurder Huis73

Oproep om ongelezen werk in te zetten voor GPT-NL

Jeugdbieb organiseert opzoekwedstrijd voor het basisonderwijs

Nieuwe directeur voor Bibliotheek Veldhoven

Stichting SPN verwelkomt nieuwe programmamanager

Verzamelen en archiveren (meta)data over bestorming Capitool VS reeds begonnen

Gerelateerd

Geef een reactie

Gerelateerde berichten