Los archivos DOC son (se supone que son) un formato "heredado". A veces, los archivos DOC estaban en formato binario y, a veces, el archivo DOC era un RTF de texto sin formato con extensiones de Word.
Los archivos DOCX son XML de texto plano y otros datos (por ejemplo, imágenes) almacenados en un árbol de carpetas comprimidos y almacenados en formato zip. Puede cambiar la extensión a ZIP y luego abrirlos. (Práctico para extraer imágenes).
Word 2010 en Windows solo cambiará la extensión del archivo a DOC si usa "guardar como" pero sigue siendo un archivo DOCX comprimido.
Si lo guarda como RTF, probablemente podrá reproducir el comportamiento en su entorno de Windows.
Hice una prueba con una sola página de texto de un libro elegido al azar del Proyecto Gutenberg:
- RTF = 205KB
- DOCX = 25KB
- RTF comprimido usando software de terceros = 31KB
Así que mi mejor conjetura es que la diferencia en el tamaño del archivo se debe a la compresión ZIP.
¿Vista protegida? tal vez el archivo esté dañado, quizás tenga una macro VBA incrustada y tengan un bloqueo del 100% en la política de macros, quién sabe. Me gustaría hacer esa pregunta por separado.