Badanie wiarygodności ChatGPT vs Gemini vs Grok pokazuje, że Google wprowadza w błąd mniej, ale dezinformacja AI podwoiła się

Gemini od Google jest jednym z bardziej wiarygodnych chatbotów opartych na sztucznej inteligencji. (Źródło obrazu: Google)

W przeciwieństwie do poprzednich lat swojego istnienia, chatboty oparte na sztucznej inteligencji wypluwają teraz odpowiedzi i fragmenty informacji na wszystkie pytania związane z wiadomościami, które są im zadawane. Niestety, oznacza to również, że liczba odpowiedzi, które są ewidentnie fałszywe, również wzrosła, z wyjątkiem jednego narzędzia AI.

Daniel Zlatev (tłumaczenie Ninh Duy), Opublikowany 12/09/2025 🇺🇸 🇪🇸 ...

AI Fail

Odpowiedzi Google Gemini są drugimi najbardziej wiarygodnymi wśród dziesięciu wiodących chatbotów AI, podczas gdy ChatGPT zajmuje siódme miejsce z 40% przekłamań w odpowiedziach na pytania dotyczące istotnych tematów wiadomości. Wskaźnik dezinformacji Google Gemini wzrósł jednak ponad dwukrotnie w ciągu roku, z około 7% w sierpniu 2024 r. do 17%, gdy badanie testowe zostało powtórzone w sierpniu ubiegłego roku.

Badacze, którzy regularnie przeprowadzają audyty wiarygodności dziesięciu najpopularniejszych narzędzi sztucznej inteligencji, przypisali drastyczny wzrost fałszu, który wypluwają - 18% w 2024 r. wobec 35% obecnie - zwiększonej konkurencji wśród chatbotów opartych na sztucznej inteligencji. Na przykład, gdy chatbot nie znał odpowiedzi na pytanie dotyczące wiadomości w 2024 r., w 31% przypadków po prostu zwracał puste zapytanie.

Jednak w sierpniu 2025 r. liczba przypadków braku odpowiedzi spadła do zera, przy jednoczesnym wzroście liczby nieprawdziwych informacji podawanych jako odpowiedzi. Najgorszym przestępcą był Inflection, którego chatbot Pi szczyci się próbą naśladowania inteligencji emocjonalnej człowieka. Inteligencja emocjonalna najwyraźniej wiąże się jednak z uleganiem fałszywym źródłom wiadomości i jawnej propagandzie stworzonej w celu zalania Internetu kłamstwami zaprojektowanymi w celu nachylenia algorytmów sztucznej inteligencji w określonym kierunku.

Sam Altman z OpenAI przyznał się do problemu dezinformacji ChatGPT w niedawnym wywiadzie dla https://www.youtube.com/watch?v=DB9mjd-65gw&t=2smówiąc, że to, co nie daje mu spać w nocy, to rozbieżność między tym, jak łatwo jest osadzić go w przyszłych modelach, a poziomem zaufania, jaki ludzie wyrażają wobec odpowiedzi ChatGPT.

Najbardziej wiarygodnym narzędziem sztucznej inteligencji okazał się Claude firmy Anthropic, z zaledwie 10% fałszywych odpowiedzi na te same zapytania, które zostały uruchomione przez innych, co jest poziomem niezmienionym w stosunku do tego samego audytu przeprowadzonego w sierpniu 2024 roku. Gdyby nie niezawodność Claude'a, poziom ogólnej wiarygodności wiodących chatbotów AI spadłby jeszcze bardziej drastycznie.

Po wielu rundach testów, Apple niedawno odkrył że Claude jest najbardziej wiarygodnym narzędziem AI do zasilania wirtualnego kamerdynera Siri i rozpoczął rozmowy z Anthropic, stawiając go przeciwko Google Gemini dla niestandardowej prywatnych modeli AI które będą działać na własnych serwerach w chmurze.

Ranking najbardziej wiarygodnych narzędzi AI

Claude - 10% błędnych odpowiedzi.
Gemini - 17% błędnych odpowiedzi.
Grok/You - 33% błędnych odpowiedzi.
Copilot/Mistral - 36% błędnych odpowiedzi.
ChatGPT/Meta - 40% błędnych odpowiedzi.

Badanie wiarygodności narzędzi AI dotyczy zapytań o tematy wiadomości, ponieważ to właśnie tam trafia większość działań propagandowych ukierunkowanych na AI. Naukowcy odkryli, że na przykład rosyjskie operacje wpływu wciąż zalewają strefę milionami pozornie bezsensownych kolaży obrazów AI, postów lub wiadomości rozpowszechnianych przez sieć stron internetowych Pravda, które mogą wyglądać niewinnie, ale mają na celu popchnięcie postawy narzędzi wyszukiwania AI w określonym kierunku.

Istnieje również wiele innych podmiotów próbujących wpłynąć na odpowiedzi chatbotów AI, a badanie wykazało, że gdy Google, OpenAI lub Anthropic próbowały zaktualizować swoje algorytmy, aby podłączyć jeden rodzaj źródeł fałszywych wiadomości, kampanie dezinformacyjne przeniosły się do innych luk w tym, co kształtuje się na ciągłą grę w kotka i myszkę. Efekt końcowy jest taki, że ponad jedna trzecia odpowiedzi chatbotów AI na zapytania dotyczące wiadomości w badaniu nie jest wiarygodna, podczas gdy udział dezinformacji opartych na sztucznej inteligencji wzrósł dwukrotnie w ciągu zaledwie roku.

Poziom fałszywych informacji opartych na sztucznej inteligencji stale rośnie. (Źródło obrazu: NewsGuard)

Źródło(a)

Newsguard (PDF)

Powiązane artykuły

Według nowego badania, na halucynacje AI wpływa sposób, w jaki użytkownicy się komunikują. (Źródło zdjęcia: Pexels/Ketut Subiyanto)

Badanie wykazało: Użytkownicy są prawdziwą przyczyną halucynacji AI 18/10/2025

Sztuczna inteligencja odpowiada obecnie za nieco ponad połowę wszystkich treści pisanych w Internecie. (Źródło obrazu: DeepAI Image Generator)

Nowe badanie pokazuje, że ponad połowa treści online jest generowana przez sztuczną inteligencję 16/10/2025

Artystyczne przedstawienie Elona Muska na tle Wikipedii. (Źródło obrazu: Wikipedia, edytowane)

Grokipedia będzie wersją Wikipedii Elona Muska 02/10/2025

Ochrona danych w teście: Które modele AI najbardziej szanują Państwa dane? (Źródło obrazu: GPT-image-1)

Ochrona danych pod lupą: Badanie ocenia i klasyfikuje modele sztucznej inteligencji pod kątem prywatności użytkowników 26/09/2025

xAI wypuszcza Grok 4 Fast AI z wysoką ceną w stosunku do wydajności. (Źródło obrazu: xAI)

xAI Grok 4 Fast AI znacznie obniża koszty przy zachowaniu wysokiej wydajności w odpowiadaniu na podpowiedzi 22/09/2025

Koderzy Vibe muszą mierzyć się z niespójną wydajnością modeli AI (Źródło obrazu: Wygenerowano przy użyciu OpenAI)

Narzędzie open source mierzy poziom głupoty modeli AI 18/09/2025

Sztuczna inteligencja Nano Banana pomogła aplikacji Gemini w końcu pokonać ChatGPT (Źródło obrazu: Wygenerowano przy użyciu OpenAI)

Nano Banana zmieniła Gemini w najlepszą aplikację AI w App Store 18/09/2025

Ludzkie twarze z wzorami obwodów symbolizującymi sztuczną inteligencję (źródło obrazu: Gerd Altmann z Pixabay)

Użytkownik X tworzy aplikację, która generuje zagranicznych influencerów AI w celu poprawienia infrastruktury w Indiach 16/09/2025

Prywatność ChatGPT: Co ujawniają o nas nasze rozmowy. (Źródło obrazu: GPT-image-1)

Prywatność ChatGPT: Co Państwa rozmowy ujawniają na Państwa temat 09/09/2025

ChatGPT nie działa: Użytkownicy na całym świecie zgłaszają awarię 03/09/2025

Wkrótce zostanie dodana funkcja kontaktów alarmowych, z którymi będzie można skontaktować się bezpośrednio z ChatGPT. Ogólny obraz przedstawiający osobę wchodzącą w interakcję z ChatGPT. (Źródło obrazu: Matheus Bertelli, Pexels)

ChatGPT wprowadzi kontrolę rodzicielską i inne zabezpieczenia w następstwie pozwu sądowego 28/08/2025

Pojawiła się nowa bezprzewodowa ład...

Gracze krytykują ceny własnych gier...

Editor of the original article: Daniel Zlatev - Senior Tech Writer - 1937 articles published on Notebookcheck since 2021

Translator: Ninh Ngoc Duy - Editorial Assistant - 645216 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 09 > Badanie wiarygodności ChatGPT vs Gemini vs Grok pokazuje, że Google wprowadza w błąd mniej, ale dezinformacja AI podwoiła się

Daniel Zlatev, 2025-09-12 (Update: 2025-09-12)