Ένας έλεγχος 2,5 εκατομμυρίων ακαδημαϊκών εργασιών εντόπισε σχεδόν 3.000 βιοϊατρικές επιστημονικές εργασίες που περιέχουν ψευδείς αναφορές — αναφορές που δεν μπορούσαν να εντοπιστούν σε γνωστές δημοσιεύσεις.
Τα ευρήματα, που δημοσιεύθηκαν στο The Lancet στις 7 Μαΐου 2019 , περιέχονται στην πρώτη ακαδημαϊκή μελέτη για την εκτίμηση της κλίμακας των ψευδών παραπομπών στη βιοϊατρική βιβλιογραφία.
Οι συγγραφείς σχεδίασαν μια αυτοματοποιημένη διαδικασία για την εξέταση εργασιών από το PubMed Central — μια βάση δεδομένων με δημόσια προσβάσιμα βιοϊατρικά άρθρα — που δημοσιεύθηκαν μεταξύ Ιανουαρίου 2023 και Φεβρουαρίου 2026.
Η εργασία τους υποδηλώνει ότι η μόλυνση των εργασιών με ψευδείς παραπομπές αποτελεί ένα ταχέως αναπτυσσόμενο πρόβλημα στη βιοϊατρική. Υπήρξαν 12 φορές περισσότερες δημοσιεύσεις με κατασκευασμένες παραπομπές το 2025 σε σύγκριση με το 2023 (βλ. «Αύξηση των κατασκευασμένων παραπομπών»).

Πηγή: Αναφ. 1
Τα ευρήματα αποτελούν «συντηρητικές υποεκτιμήσεις», λέει ο συν-συγγραφέας της μελέτης, Maxim Topaz, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο Columbia στη Νέα Υόρκη. «Αυτό που εντοπίσαμε είναι το κατώτερο όριο της πραγματικής επικράτησης. Ξύνουμε την κορυφή του παγόβουνου», προσθέτει.
Η Κάθριν Βέμπερ-Μπόερ, διευθύντρια σαηεντομετρίας στην εταιρεία Digital Science με έδρα το Λονδίνο, συμφωνεί. Η μελέτη αποτελεί «μια πρώτη, ουσιαστική συμβολή στο πρόβλημα», λέει. (Η Digital Science λειτουργεί από την Holtzbrinck Publishing Group, τον πλειοψηφικό μέτοχο της Springer Nature, η οποία εκδίδει το Nature . Η ομάδα ειδήσεων του Nature είναι συντακτικά ανεξάρτητη από τον εκδότη της.)
Μια ανάλυση του Nature που δημοσιεύτηκε τον Απρίλιο εκτίμησε ότι περίπου το 1,6% των δημοσιεύσεων από το 2025 περιείχε τουλάχιστον μία αναφορά που αντιστοιχούσε σε μια δημοσίευση που δεν φαινόταν να υπάρχει.
Αναντιστοιχίες αναφορών
Στη μελέτη τους, ο Topaz και οι συνάδελφοί του ανέπτυξαν ένα σύστημα για την επιθεώρηση των 125,6 εκατομμυρίων αναφορών που αναφέρθηκαν από 2,5 εκατομμύρια άρθρα. Εστίασαν την ανάλυση σε 97 εκατομμύρια αναφορές που είχαν έγκυρους Αναγνωριστές Ψηφιακών Αντικειμένων (DOI) – μοναδικές συμβολοσειρές γραμμάτων και αριθμών που είχαν εκχωρηθεί από εκδότες και αποθετήρια προεκτυπώσεων – ή ένα αναγνωριστικό που είχε εκχωρηθεί από τη βάση δεδομένων PubMed.
Χρησιμοποίησαν μεγάλα γλωσσικά μοντέλα (LLM) για να εντοπίσουν τυχόν αναντιστοιχίες μεταξύ του τίτλου του άρθρου σε κάθε παραπομπή και του τίτλου της εργασίας στην οποία οδηγούσε το DOI ή το PubMed ID της. Επίσης, αναζήτησαν τις παραπομπές σε τέσσερις επιστημονικές βάσεις δεδομένων: PubMed, Crossref, OpenAlex και Google Scholar. Εάν ο τίτλος μιας παραπομπής δεν εμφανιζόταν σε καμία από αυτές τις βάσεις δεδομένων, η ομάδα θεωρούσε ότι ήταν κατασκευασμένη.
Οι παραισθησιογόνες αναφορές μολύνουν την επιστημονική βιβλιογραφία. Τι μπορεί να γίνει;
Η ανάλυση εντόπισε 2.564 άρθρα που περιείχαν μία ή δύο κατασκευασμένες αναφορές και 246 άρθρα που περιείχαν τρεις ή περισσότερες.
«Είτε κατασκευάζονται από υπολογιστή είτε από άνθρωπο, αυτό είναι ένα ερώτημα που παραμένει ανοιχτό», λέει η Weber-Boer. Αλλά προσθέτει ότι «η αύξηση του προβλήματος υποδηλώνει ότι υπάρχει ένα γενετικό στοιχείο Τεχνητής Νοημοσύνης ».
Σε έναν χειροκίνητο έλεγχο 500 επισημασμένων αναφορών, τρεις ανεξάρτητοι κριτές επιβεβαίωσαν ότι οι παραπομπές ήταν κατασκευασμένες σε επτά από τις δέκα περιπτώσεις.
Ωστόσο, η ανάλυση πιθανώς υποεκτιμά τον συνολικό αριθμό των εργασιών που περιλαμβάνουν ψευδείς παραπομπές. «Το Google Scholar δεν αποτελεί αξιόπιστη πηγή» για την επαλήθευση αναφορών, σημειώνει η Weber-Boer, επειδή ορισμένες κατασκευασμένες αναφορές εμφανίζονται στον ιστότοπο, αλλά δεν συνδέονται με γνήσιες δημοσιεύσεις.