Consejos

Cómo analizar un archivo línea por línea con Python

Cómo analizar un archivo línea por línea con Python

Una de las razones principales por las que las personas usan Python es para analizar y manipular texto. Si su programa necesita trabajar a través de un archivo, generalmente es mejor leer en el archivo una línea a la vez por razones de espacio de memoria y velocidad de procesamiento. Esto se hace mejor con un bucle while.

Ejemplo de código para analizar texto línea por línea

fileIN = open (sys.argv1, "r") line = fileIN.readline () mientras line: un poco de análisis aquí line = fileIN.readline ()

Este código toma el primer argumento de la línea de comando como el nombre del archivo a procesar. La primera línea lo abre e inicia un objeto de archivo, "fileIN". La segunda línea lee la primera línea de ese objeto de archivo y la asigna a una variable de cadena, "línea". El bucle while se ejecuta en función de la constancia de "línea". Cuando la "línea" cambia, el bucle se reinicia. Esto continúa hasta que no haya más líneas del archivo para leer. El programa se cierra.

Al leer el archivo de esta manera, el programa no extrae más datos de los que está configurado para procesar. Procesa los datos que ingresa más rápido, dando su salida de forma incremental. De esta manera, la huella de memoria del programa se mantiene baja y la velocidad de procesamiento de la computadora no se ve afectada. Esto puede ser importante si está escribiendo un script CGI que puede ver unos cientos de instancias de sí mismo ejecutándose a la vez.

Más sobre "Mientras" en Python

La instrucción del bucle while ejecuta repetidamente una instrucción de destino siempre que la condición sea verdadera. La sintaxis del bucle while en Python es:

expresión while: declaración (s)

La declaración puede ser una declaración única o un bloque de declaraciones. Todas las declaraciones sangradas por la misma cantidad se consideran parte del mismo bloque de código. La sangría es cómo Python indica grupos de declaraciones.