Tengo un TXT
archivo grande delimitado con TAB
.
El texto está entre comillas, pero Excel aún divide los valores en dos filas cuando aparece un carácter CR dentro de la cadena encapsulada.
¿Hay alguna forma de obligar a Excel a no romper líneas?
Tengo un TXT
archivo grande delimitado con TAB
.
El texto está entre comillas, pero Excel aún divide los valores en dos filas cuando aparece un carácter CR dentro de la cadena encapsulada.
¿Hay alguna forma de obligar a Excel a no romper líneas?
Respuestas:
La siguiente respuesta destaca en parte el problema.
Como J Ashley señala correctamente, hay una diferencia entre cómo Excel maneja el archivo CSV al hacer doble clic en vs Archivo-> Abrir (o Datos-> importar).
Además del comentario de J Ashley, probé y concluí lo siguiente:
Por lo tanto, no parece haber ninguna forma de solucionar este problema desde Excel.
Posible solución
Haga una búsqueda / reemplazo de expresiones regulares en su archivo para cambiar '\ r ([^ \ n])' a '\ n \ 1'. Esto cambia todos los CR que no son seguidos por un LF en un LF. El \ 1 es solo para preservar el carácter final.
Problemas finales
Excel me sigue sorprendiendo de maneras misteriosas en cuanto a lo arbitrario que es manejar archivos de datos de texto sin proporcionar comentarios al usuario ... Por otra parte, la mayoría de los usuarios se sentirían abrumados y confundidos por la idea de que los archivos de texto sin formato no son archivos de Excel .
Editar: secuencia de comandos Powershell para buscar reemplazar en archivos enormes
$Utf8NoBomEncoding = New-Object System.Text.UTF8Encoding $False
Get-Content -Encoding UTF8 -ReadCount 1000 input.txt |
Foreach-Object {
[System.IO.File]::AppendAllLines(
[string]'output.txt'
, [string[]]($_) // TODO: add regex replacement here
)
}
txt
archivo es difícil ya que es muy grande. En realidad, hay varios, pero el tamaño varía entre 1 y 10 GB y puede contener entre 500k y 12M de filas. La mayoría de los editores de texto se resisten al tamaño.