En este caso particular, me refiero al día en que se congela un lago. Esta fecha de "hielo" solo ocurre una vez al año, pero a veces no ocurre en absoluto (si el invierno es cálido). Entonces, en un año, el lago puede congelarse el día 20 (20 de enero), y otro año podría no congelarse en absoluto.
El objetivo es descubrir los conductores de la fecha de hielo.
Los predictores serían cosas como la temperatura del aire en otoño / invierno cada año. El año podría ser un predictor de la tendencia lineal a largo plazo.
1) ¿Es el entero "día del año" una variable de respuesta razonable (si no, qué es?)
2) ¿Cómo se deben manejar los años en que el lago nunca se congeló?
Editar:
No sé cuál es la etiqueta aquí, pero pensé que publicaría el resultado de las sugerencias que recibí. Aquí está el papel, acceso abierto . Recibí buenos comentarios sobre el enfoque utilizado, gracias @pedrofigueira y @cboettig. Por supuesto, los errores son míos.