Hay un par de formas diferentes de eliminar HTML tags
un archivo NSString
in Cocoa
.
Una forma es convertir la cadena en un NSAttributedString
y luego tomar el texto renderizado.
Otra forma es usar NSXMLDocument's
- objectByApplyingXSLTString
método para aplicar una XSLT
transformación que lo haga.
Desafortunadamente, el iPhone no es compatible con NSAttributedString
o NSXMLDocument
. Hay demasiados casos extremos y HTML
documentos mal formados para que me sienta cómodo usando expresiones regulares o NSScanner
. ¿Alguien tiene una solución para esto?
Una sugerencia ha sido simplemente buscar caracteres de etiqueta de apertura y cierre, este método no funcionará excepto en casos muy triviales.
Por ejemplo, estos casos (del capítulo del libro de recetas de Perl sobre el mismo tema) romperían este método:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>