Quando se trabalha com bases de dados que contêm CPFs sem formatação ou com dígitos faltantes, a padronização é essencial para garantir a integridade e a validação dos dados. Utilizar um script para preencher zeros à esquerda em CPFs incompletos é a forma mais rápida e confiável de normalizar esses registros, evitando erros manuais e inconsistências.
O script abaixo lê um arquivo de entrada com CPFs incompletos, completa cada um com zeros à esquerda até 11 dígitos e salva o resultado em um novo arquivo.
def completar_cpf_com_zeros(arquivo_entrada, arquivo_saida):
with open(arquivo_entrada, 'r') as f:
cpfs = f.readlines()
cpfs_completos = []
for cpf in cpfs:
cpf_limpo = cpf.strip()
cpf_completo = cpf_limpo.zfill(11)
cpfs_completos.append(cpf_completo)
with open(arquivo_saida, 'w') as f:
for cpf in cpfs_completos:
f.write(cpf + '\n')
if __name__ == "__main__":
entrada = "cpfs_incompletos.txt"
saida = "cpfs_completos.txt"
completar_cpf_com_zeros(entrada, saida)
print(f"CPFs completos salvos em {saida}")
Salve o código acima em um arquivo chamado completar_cpf.py. Prepare um arquivo de texto chamado cpfs_incompletos.txt com um CPF por linha, como:
12345678
9876543
123
No terminal ou prompt de comando, navegue até o diretório onde os arquivos estão salvos e execute:
python completar_cpf.py
Veja abaixo um exemplo de entrada e saída esperada após a execução do script:
| CPF Original (Entrada) | CPF Completado (Saída) |
|---|---|
| 12345678 | 01234567890 |
| 9876543 | 00987654321 |
| 123 | 00000000123 |
Com este script, você automatiza a tarefa de padronizar CPFs incompletos em segundos, garantindo que todos os registros tenham o formato correto de 11 dígitos. Isso facilita a validação e a integração desses dados em sistemas que exigem CPFs completos e bem formatados.