Apareció hace unas semanas un test al que se sometía a varios LLM's, consistente en pedir que creasen una rutina en Python que modelase una pelotilla rebotando por dentro de las paredes de un cuadrado que rota. Por lo visto solo Grok 3 dio una solución correcta, los demás modelos no detectaban bien las colisiones y la pelota se salía del cuadrado o hacía cosas raras.