Choć sztuczna inteligencja potrafi generować teksty, tłumaczyć języki i analizować ogromne zbiory danych, w starciu z klasycznymi łamigłówkami liczbowymi, takimi jak sudoku, okazuje się zaskakująco bezradna. Najnowsze badania pokazują, że nawet najbardziej zaawansowane modele AI mają poważne trudności z rozwiązywaniem i uzasadnianiem logicznych zagadek.

Sudoku - wyzwanie nie tylko dla ludzi

Sudoku od lat cieszy się niesłabnącą popularnością na całym świecie. Ta pozornie prosta łamigłówka, polegająca na wypełnieniu planszy cyframi według określonych zasad, wymaga od gracza nie tylko cierpliwości, ale przede wszystkim logicznego myślenia. Jak się okazuje, te same wymagania stanowią ogromną przeszkodę dla sztucznej inteligencji.

Badania obnażają słabości AI

Zespół naukowców z Uniwersytetu Kolorado w Boulder w USA postanowił sprawdzić, jak zaawansowane modele językowe radzą sobie z sudoku. W eksperymencie wykorzystano 2300 plansz o różnym stopniu trudności w wersji 6x6, a do ich rozwiązania zaprzęgnięto najnowsze modele AI, takie jak o1, Llama-3.1, Gemma-2 i Mistral.

Wyniki były jednoznaczne - sztuczna inteligencja rozwiązała zaledwie 0,4 proc. wszystkich łamigłówek. Najlepiej poradził sobie model o1, osiągając skuteczność na poziomie 65 proc. w najłatwiejszych przypadkach, jednak wraz ze wzrostem trudności skuteczność gwałtownie spadała.

AI nie potrafi wyjaśnić swoich decyzji

Jeszcze większym wyzwaniem dla sztucznej inteligencji okazało się uzasadnienie podjętych decyzji. Modele AI poprawnie tłumaczyły swoje rozwiązania tylko w 5 proc. przypadków. Często pojawiały się błędne lub zupełnie niezwiązane z tematem odpowiedzi.

Zdarzało się nawet, że zamiast wyjaśnienia ruchu w sudoku, AI generowała... prognozę pogody.

Eksperci tłumaczą, że główną przyczyną tych niepowodzeń jest fakt, że sztuczna inteligencja nie rozumuje logicznie, lecz bazuje na prawdopodobieństwie i wzorcach z danych, na których została wytrenowana. W zadaniach wymagających ścisłego przestrzegania reguł i analizy wielu zależności jednocześnie, AI wciąż pozostaje daleko w tyle za człowiekiem.