Mis matrices numpy se utilizan np.nan
para designar valores faltantes. A medida que repito el conjunto de datos, necesito detectar esos valores faltantes y manejarlos de formas especiales.
Usé ingenuamente numpy.isnan(val)
, que funciona bien a menos val
que no esté entre el subconjunto de tipos admitidos por numpy.isnan()
. Por ejemplo, los datos faltantes pueden ocurrir en campos de cadena, en cuyo caso obtengo:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
Aparte de escribir un contenedor costoso que detecta la excepción y devuelve False
, ¿hay alguna manera de manejar esto de manera elegante y eficiente?
pandas.isnull()
parece funcionar perfectamente. El único tipo de datos con el que estoy tratando actualmente que se rompe numpy.isnan()
es la cadena y lo pandas.isnull()
maneja bien. De hecho, parece manejar bien cualquier objeto arbitrario que le arroje. ¿Hubo algún problema específico que le preocupara? De lo contrario, es posible que desee enviar su comentario como una respuesta completa, ya que parece la respuesta canónica, al menos para los usuarios de pandas.
pandas
tienepandas.isnull()
: no estoy seguro de si eso satisface sus necesidades, por lo que algunos datos de ejemplo podrían ser buenos.