Para el diseño tenemos nuestro famoso texto "Lorem ipsum" para probar cómo se ve.
Lo que estoy buscando es un conjunto de archivos que contengan texto codificado con varias codificaciones diferentes que pueda usar en mis pruebas JUnit para probar algunos métodos que se ocupan de la codificación de caracteres al leer archivos de texto.
Ejemplo:Tener un ISO 8859-1
archivo de Windows-1252
prueba codificado y un archivo de prueba codificado. El Windows-1252 tiene que activar las diferencias en la región 80 16 - 9F 16 . En otras palabras, debe contener al menos un carácter de esta región para distinguirlo de ISO 8859-1.
Quizás el mejor conjunto de archivos de prueba es aquel en el que el archivo de prueba para cada codificación contiene todos sus caracteres una vez. Pero tal vez no estoy al tanto de algo, a todos nos gusta esta codificación, ¿verdad? :-)
¿Existe tal conjunto de archivos de prueba para problemas de codificación de caracteres?