Ψηφιακή αποσύνθεση: Πώς το Ίντερνετ εξαφανίζεται- με τι ρυθμούς χάνονται οι ιστοσελίδες

Μελέτη του Pew Research Center δείχνει πόσο εφήμερο είναι το online περιεχόμενο.
Open Image Modal
Aleksandra Konoplia via Getty Images

Το Ίντερνετ έχει ενσωματωθεί στην καθημερινή ζωή σε βαθμό που θα ήταν αδιανόητος όχι πολλά χρόνια πριν- εκατοντάδες δισεκατομμύρια είναι οι ιστοσελίδες που χρήστες ανά όλο τον κόσμο χρησιμοποιούν για ενημέρωση, δουλειά, ψυχαγωγία κ.α. Το περιεχόμενο αυτό, ωστόσο, κάποιες φορές απλά...εξαφανίζεται- και νέα έρευνα του Pew Research Center δείχνει πόσο εφήμερο είναι τελικά το online περιεχόμενο στην πραγματικότητα.

Σύμφωνα με την έρευνα:

  • -Το 1/4 όλων των ιστοσελίδων που υπήρχαν σε μια χρονική στιγμή μεταξύ του 2013 και του 2023 δεν ήταν πλέον προσβάσιμες τον Οκτώβριο του 2023. Στις πιο πολλές περιπτώσεις αυτό οφείλεται στη διαγραφή μιας ιστοσελίδας ή στην απομάκρυνσή της από ένα κατά τα άλλα λειτουργικό website.
  • -Η τάση αυτή είναι ακόμα πιο έντονη για το παλαιότερο περιεχόμενο. Περίπου το 38% των ιστοσελίδων που υπήρχαν το 2013 δεν είναι διαθέσιμες σήμερα, συγκριτικά με το 8% των σελίδων που υπήρχαν το 2023.

Αυτή η «ψηφιακή αποσύνθεση» σημειώνεται σε πολλούς διαφορετικούς online χώρους. Στο πλαίσιο της έρευνας εξετάστηκαν links που εμφανίζονταν σε κυβερνητικές και ειδησεογραφικές ιστοσελίδες, καθώς και στην κατηγορία των «references» της Wikipedia την άνοιξη του 2023. Η ανάλυση έδειξε τα εξής:

  • -Το 23% των ειδησεογραφικών ιστοσελίδων περιέχουν τουλάχιστον ένα μη λειτουργικό link, όπως και το 21% των σελίδων από κυβερνητικά sites. Τα ειδησεογραφικά sites με υψηλό επίπεδο traffic και αυτά με χαμηλότερο είναι σε γενικές γραμμές εξίσου πιθανό να περιέχουν μη λειτουργικά links. Οι κυβερνητικές ιστοσελίδες τοπικού επιπέδου (τοπικής αυτοδιοίκησης) είναι ιδιαίτερα πιθανό να έχουν μη λειτουργικά links.
  • -Το 54% των σελίδων της Wikipedia περιέχουν τουλάχιστον ένα link στα «References» που στέλνει σε μια σελίδα η οποία πλέον δεν υπάρχει.

Για να διαπιστωθεί πώς εκφράζεται η «ψηφιακή αποσύνθεση» στα μέσα κοινωνικής δικτύωσης, συγκεντρώθηκε επίσης ένα δείγμα σε πραγματικό χρόνο με tweets την άνοιξη του 2023 και οι ερευνητές τα παρακολούθησαν για τρεις μήνες. Όπως προέκυψε:

  • -Περίπου το ένα στα πέντε tweets δεν είναι πλέον δημόσια ορατό στο site μέσα λίγους μόλις μήνες μετά την ανάρτησή του. Στο 60% αυτών των περιπτώσεων ο λογαριασμός που το είχε ανεβάσει έχει γίνει «private», έχει μπλοκαριστεί ή διαγραφεί. Στο άλλο 40% ο χρήστης διέγραψε μόνος του το tweet, αν και ο ίδιος ο λογαριασμός υπήρχε ακόμα.
  • -Συγκεκριμένοι τύποι tweets τείνουν να εξαφανίζονται συχνότερα από άλλους. Πάνω από 40% των tweets στα τουρκικά ή αραβικά δεν είναι πλέον ορατά μέσα σε διάστημα τριών μηνών από την ανάρτησή τους. Και τα tweets από λογαριασμούς με default profile settings είναι ιδιαίτερα πιθανό να εξαφανιστούν.

Για τους σκοπούς της μελέτης οι ερευνητές συνέλεξαν ένα τυχαίο δείγμα από κάτι λιγότερο από ένα εκατομμύριο ιστοσελίδες από τα αρχεία του Common Crawl, το οποίο καταγράφει «στιγμιότυπα» του Ίντερνετ όπως αυτό είναι σε συγκεκριμένες χρονικές στιγμές. Εξετάστηκαν σελίδες που συγκέντρωνε το Common Crawl κάθε χρόνο από το 2013 ως το 2023 (περίπου 90.000 σελίδες τον χρόνο) και ελέγχθηκε κατά πόσον υπάρχουν ακόμα σήμερα. Όπως διαπιστώθηκε, το 25% όλων των σελίδων που συγκεντρώθηκαν από το 2013 ως το 2023 δεν ήταν πλέον προσβάσιμες τον Οκτώβριο του 2023.

Το ποσοστό αυτό αποτελείται από δύο διαφορετικούς τύπους μη λειτουργικών σελίδων: Το 16% των σελίδων δεν είναι προσβάσιμες μα προέρχονται από ένα κατά τα άλλα λειτουργικό «root-level» domain, ενώ το υπόλοιπο 9% δεν είναι προσβάσιμες επειδή όλο το root domain δεν είναι πλέον λειτουργικό. Τα παλαιότερα «στιγμιότυπα» είχαν τα πιο πολλά μη προσβάσιμα links. Από τις σελίδες που κατεγράφησαν από το «στιγμιότυπο» του 2013, το 38% δεν ήταν πλέον προσβάσιμες το 2023. Μα ακόμα και για σελίδες που κατεγράφησαν το 2021, περίπου 1 στις 5 δεν ήταν πλέον προσβάσιμη μόλις δύο χρόνια μετά.