Σχεδόν οι μισές απαντήσεις που δίνουν οι δημοφιλέστερες υπηρεσίες ΑΙ σε ερωτήσεις για την επικαιρότητα περιέχουν λάθη, δείχνει μεγάλη μελέτη που παρουσίασαν η Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση (EBU) και το BBC.
Η διεθνής μελέτη εξέτασε 3.000 ερωτήσεις που υποβλήθηκαν από μέσα ενημέρωσης στo ChatGPT της OpenAI, το Copilot της Microsoft, το Gemini της Google και το Perplexity.
Η δοκιμή εξέτασε τις απαντήσεις της ΑΙ σε 14 γλώσσες για να προσδιορίσει την αξιοπιστία, την παράθεση πηγών και την ικανότητα να διαχωρίζουν τα γεγονότα από τις απόψεις.
Το 85% των απαντήσεων εμφάνιζε τουλάχιστον ένα προβληματικό σημείο, ενώ το 45% τουλάχιστον ένα σημαντικό πρόβλημα, έδειξε η ανάλυση.
Μια απάντηση στις πέντε περιείχε μάλιστα «μείζονα λάθη», με παρωχημένες πληροφορίες, ακόμη και με «επινοημένες λεπτομέρειες».
Από τις τέσσερις εφαρμογές, το Gemini είχε τις χειρότερες επιδόσεις, με «σημαντικά προβλήματα» στα τρία τέταρτα των απαντήσεών του, «υπερδιπλάσια απ’ ό,τι στις άλλες εφαρμογές», κυρίως λόγω των «μέτριων επιδόσεών του» στην ορθή αναφορά της πηγής μιας πληροφορίας.
Ποιος είναι πάπας;
Είκοσι δύο δημόσια μέσα ενημέρωσης δεκαοκτώ χωρών, τα περισσότερα ευρωπαϊκά, πήραν μέρος στη μελέτη. Από τα τέλη Μαΐου ως τις αρχές Ιουνίου, κάθε μέσο ενημέρωσης έθεσε τα ίδια ερωτήματα σχετικά με την επικαιρότητα στις εφαρμογές τεχνητής νοημοσύνης, ζητώντας τους να αναζητήσουν τις απαντήσεις στα περιεχόμενά του.
Σε 3.000 απαντήσεις, οι παρωχημένες πληροφορίες ήταν ένα από τα συχνότερα προβλήματα.
Στην ερώτηση «Ποιος είναι πάπας;», η απάντηση που έδωσαν το ChatGPT το Copilot και το Gemini ήταν «ο Φραγκίσκος», ο οποίος απεβίωσε πριν από μήνες.
Σε κάποιες περιπτώσεις, τα μοντέλα μπέρδευαν τα γεγονότα με ευφυολογήματα. Σε ερώτηση για τον φερόμενο ναζιστικό χαιρετισμό του Έλον Μασκ κατά την ορκωμοσία του Ντόναλντ Τραμπ τον Ιανουάριο, το Gemini έγραψε ότι ο δισεκατομμυριούχος είχε «στύση του δεξιού βραχίονα».
Προφανώς είχε εκλάβει κυριολεκτικά ένα σατιρικό χρονογράφημα της χιουμορίστα Σαρλίν Βανχένακερ, ανέφεραν οι ερευνητές.
Με τους βοηθούς ΑΙ να αντικαθιστούν όλο και περισσότερο τις παραδοσιακές μηχανές αναζήτησης για ειδήσεις, η τεχνολογία υπονομεύει την εμπιστοσύνη του κοινού, προειδοποίησε η EBU.
«Όταν ο κόσμος δεν ξέρει τι να πιστέψει, καταλήγει να μην πιστεύει τίποτα, και αυτό μπορεί να αποθαρρύνει τη δημοκρατική συμμετοχή» δήλωσε ο διευθυντής μέσων της EBU Ζαν Φιλίπ Ντε Τεντέρ.
Περίπου το 7& των καταναλωτών ειδησεογραφικού περιεχομένου στην ηλικιακή ομάδα των κάτω των 25 ετών χρησιμοποιεί chatbot για την ενημέρωσή του, σύμφωνα με φετινή έκθεση του Reuters.
Οι συντάκτες της νέας μελέτης θεωρούν ότι οι εταιρείες ΑΙ πρέπει να θεωρούνται υπεύθυνες για τις απαντήσεις των μοντέλων τους σε θέματα επικαιρότητας.






