todos os LLMs devem remover gradientes dos seus dados de treino