66. Międzynarodowa Olimpiada Matematyczna (IMO) w Australii była bardzo ważna dla sztucznej inteligencji. Po raz pierwszy w konkursie, model Gemini firmy Google DeepMind "Deep Think" Google DeepMind osiągnął złoty medal, rozwiązując pięć z sześciu wyjątkowo trudnych problemów olimpijskich i zdobywając 35 z 42 punktów, co odpowiada złotemu progowi ustalonemu przez komisję oceniającą IMO.
Jest to spora poprawa w stosunku do ubiegłego roku, kiedy to AlphaProof i AlphaGeometry 2 firmy DeepMind osiągnęły jedynie srebrny medal, rozwiązując cztery problemy i zdobywając 28 punktów. Poprzednie systemy wymagały tłumaczenia między językiem naturalnym a formalnymi językami dowodowymi, a obliczanie rozwiązań zajmowało kilka dni.
W tym roku Gemini działał od początku do końca używając tylko języka naturalnego, tworząc pełne, rygorystyczne rozwiązania bezpośrednio z oficjalnych opisów IMO w ciągu 4,5-godzinnego okna konkursowego. Oficjalni sędziowie IMO - którzy oceniają również ludzkich uczestników - opisali odpowiedzi Gemini jako "jasne" i "precyzyjne" DeepMind przypisuje ten postęp zaawansowanym technikom uczenia się ze wzmocnieniem, wyselekcjonowanej bazie danych rozwiązań matematycznych i nowym równoległym metodom rozumowania, które umożliwiają jednoczesne badanie wielu ścieżek rozwiązań. Podczas gdy inne systemy sztucznej inteligencji, w tym te z OpenAIpodobno osiągnęły podobne nieoficjalne wyniki, ocena Gemini została formalnie certyfikowana przez koordynatorów olimpiady, co jest pierwszym na świecie autonomicznym systemem matematycznym.
DeepMind planuje udostępnić model Deep Think wybranym matematykom przed szerszym wdrożeniem, jednocześnie kontynuując wdrażanie zarówno agentów języka naturalnego, jak i formalnego rozumowania do badań matematycznych.