Probleem Datalek bij Internet Archive

Datalek bij Internet Archive

De Wayback Machine van het Internet Archive heeft een significante datalek ervaren nadat een cybercrimineel de website had gecompromitteerd, wat leidde tot de diefstal van een gebruikersauthenticatiedatabase met 31 miljoen unieke records. Dit lek kwam aan het licht toen bezoekers van archive.org een JavaScript-waarschuwing tegenkwamen die door de hacker was opgesteld, die hen op de hoogte stelde van het lek.

De waarschuwing gaf een bericht weer: 'Heb je ooit het gevoel gehad dat het Internet Archive op stokjes draait en voortdurend op het randje van een catastrofale beveiligingsinbreuk staat? Het is gewoon gebeurd. Zie 31 miljoen van jullie op HIBP!' De afkorting 'HIBP' staat voor de Have I Been Pwned-service, die datalekken bijhoudt.

De Wayback Machine: een digitale tijdcapsule voor het internet

De Wayback Machine, in 2001 gecreëerd door het Internet Archive, dient als een essentieel hulpmiddel voor het bewaren van de digitale geschiedenis van het World Wide Web. Het stelt gebruikers in staat om gearchiveerde versies van webpagina's te raadplegen die teruggaan tot 1996. Door het crawlen en opslaan van snapshots van webpagina's op verschillende tijdstippen, stelt de Wayback Machine gebruikers in staat om de vorige iteraties van websites opnieuw te bezoeken, wat een uniek perspectief biedt op de evolutie van online content en digitale cultuur.

De unieke rol van de Wayback Machine

  • Web Preservation : De Wayback Machine speelt een cruciale rol bij het archiveren van webcontent die anders verloren zou gaan door website-updates, verwijderingen of domeinverlopen. Omdat websites voortdurend evolueren, kunnen veel waardevolle bronnen, artikelen en projecten verdwijnen. De Wayback Machine zorgt ervoor dat deze materialen worden bewaard voor toekomstige toegang, en fungeert als een digitale bibliotheek van historische webpagina's.
  • Onderzoek en onderwijs : onderzoekers, historici en docenten kunnen de Wayback Machine gebruiken om de ontwikkeling van informatie in de loop van de tijd te bestuderen, veranderingen in de publieke opinie bij te houden en te analyseren hoe gebeurtenissen in het verleden werden gerapporteerd. Door gearchiveerde pagina's te openen, kunnen ze inzicht krijgen in historische trends, culturele verschuivingen en maatschappelijke veranderingen die worden weerspiegeld in het digitale domein.
  • Juridische en nalevingsbehoeften : De Wayback Machine wordt vaak aangehaald in rechtszaken waar gearchiveerde webinhoud nodig is als bewijs. Het kan belangrijke documentatie leveren van wat er op een bepaald moment online beschikbaar was, en kan helpen bij geschillen over intellectueel eigendom, smaadzaken en meer.

Het belang van internet

  • Cultural Heritage: The Wayback Machine draagt bij aan het behoud van digitaal cultureel erfgoed door de evolutie van websites, kunst, literatuur en online communities te documenteren. Het beschermt de unieke en vluchtige aard van het internet, waardoor toekomstige generaties het digitale landschap uit het verleden en de betekenis ervan kunnen begrijpen.
  • Transparantie en verantwoording: Door een openbaar verslag van het web bij te houden, bevordert de Wayback Machine transparantie en verantwoording. Het stelt gebruikers in staat om veranderingen in informatie bij te houden, verschuivingen in beleid of verklaringen van organisaties te onderzoeken en entiteiten verantwoordelijk te houden voor hun online aanwezigheid.
  • Faciliteren van innovatie: De gearchiveerde content dient als een bron voor ontwikkelaars en makers die inspiratie zoeken of willen leren van eerdere ontwerpen, functionaliteiten of contentstrategieën. De mogelijkheid om te onderzoeken hoe websites zijn veranderd, kan hedendaagse webdesign- en ontwikkelingspraktijken informeren.
  • Meer dan 30 miljoen gecompromitteerde accounts

    De gecompromitteerde database, geïdentificeerd als een 6,4 GB groot SQL-bestand met de naam ia_users.sql, bevat authenticatiegegevens voor geregistreerde gebruikers. Deze gegevens omvatten e-mailadressen, schermnamen, tijdstempels voor wachtwoordwijzigingen, Bcrypt-gehashte wachtwoorden en andere interne informatie. Opvallend is dat de laatste tijdstempel voor de records aangeeft dat ze zijn verzameld op 28 september 2024, waarmee het totale aantal unieke e-mailadressen op 31 miljoen komt.

    Het is nog steeds onduidelijk welke methode de cybercriminelen precies hebben gebruikt om het Internet Archive te hacken. Ook is nog onduidelijk of er nog meer gegevens zijn buitgemaakt.

    Dreigingsactoren richten zich met DDoS-aanvallen op het Internet Archive

    In een afzonderlijk maar gerelateerd probleem is het Internet Archive ook het doelwit geweest van een DDoS-aanval, die onlangs werd opgeëist door de hacktivistengroep BlackMeta. Deze groep heeft aangegeven plannen te hebben voor verdere aanvallen.

    De maker van het Internet Archive, Brewster Kahle, gaf een update via Twitter/X, waarin hij de datalek bevestigde en onthulde dat de hacker een JavaScript-bibliotheek gebruikte om waarschuwingen aan gebruikers te presenteren. Hij verklaarde: 'Wat we weten: DDoS-aanval voorlopig afgeweerd; verminking van onze website via JS-bibliotheek; inbreuk op gebruikersnamen/e-mail/versleutelde wachtwoorden. Wat we hebben gedaan: de JS-bibliotheek uitgeschakeld, systemen opgeschoond, beveiliging geüpgraded.'

    Een latere update meldde dat DDoS-aanvallen zijn hervat, waardoor archive.org en openlibrary.org opnieuw offline zijn gegaan. Hoewel het Internet Archive momenteel worstelt met zowel een datalek als aanhoudende DDoS-aanvallen, geloven de autoriteiten niet dat de twee incidenten met elkaar in verband staan.

    Bezig met laden...