Puede tomar el -pages-articles.xml.bz2
de la Wikimedia sitio de vertederos y procesarlos con WikiTaxi (descarga en la esquina superior izquierda). La herramienta de importación de Wikitaxi creará un .taxi
archivo (alrededor de 15 Gb para Wikipedia) a partir del .bz2
archivo. Ese archivo será utilizado por el programa WikiTaxi para buscar artículos. La experiencia es muy similar a la experiencia del navegador.
O puede usar Kiwix , más rápido de configurar porque también proporciona los volcados ( .zim
archivos) ya procesados . Como el comentario especifica para mwoffliner
poder usar otros sitios de MediaWiki para kiwix , puede que no funcione con todos, ya que pueden tener diferencias personalizadas, pero es la única variante que encontré.
Tomar material de Wikimedia wget
no es una buena práctica. Si muchas personas lo hicieran, puede inundar los sitios con solicitudes.
Más tarde edite para el caso en que desea también las imágenes sin conexión:
Si desea un espejo completo de Wikipedia (incluyendo imágenes) con formato HTML completo intacto que se descargará en aproximadamente 30 horas , debe usar:
Wikipedia en inglés tiene muchos datos. Hay más de 13.9 millones de páginas con más de 20.0 GB de texto, así como más de 3.7 millones de miniaturas.
XOWA :
Configurar todo esto en su computadora no será un proceso rápido ... La importación en sí misma requerirá 80 GB de espacio en disco y cinco horas de tiempo de procesamiento para la versión de texto. Si también desea imágenes, los números aumentan a 100 GB de espacio en disco y 30 horas de tiempo de procesamiento. Sin embargo, cuando haya terminado, tendrá una copia completa y reciente de Wikipedia en inglés con imágenes que pueden caber en una tarjeta SD de 128GB.
Pero la versión fuera de línea es muy parecida a la versión en línea, incluye fotos, etc.
(probé el siguiente artículo completamente fuera de línea)
Edición posterior si no se aplica ninguno de los anteriores:
Si el wiki no es parte de Wikimedia o no tiene un volcado, hay un proyecto en github que descarga ese wiki usando su API:
Main Page
y siga los enlaces desde allí.