En ambos casos, la lectura real del sensor se realiza línea por línea. Se hace de esa manera (en gran medida) porque hacer lo contrario sería excesivamente costoso: para leer todos los píxeles en paralelo, necesitaría una conexión separada del sensor a la memoria para cada píxel. 12 millones de conexiones (por ejemplo) del sensor a la memoria serían terriblemente costosas, y casi nunca proporcionarían ningún beneficio real.
En cuanto a por qué parece haber una diferencia entre el modo de película y el modo de imagen fija, es bastante simple: en el modo de imagen fija, está utilizando un obturador físico, y la lectura del sensor a la memoria ocurre cuando el obturador está cerrado. Como señaló @Matt Grum, aún obtienes el mismo efecto por encima de la velocidad de sincronización X, debido a las limitaciones físicas del obturador.
La razón por la que no usa el obturador físico en modo película es más de esas mismas limitaciones físicas. Si bien el obturador puede tener un tiempo de exposición muy corto, hay un tiempo de recuperación entre las activaciones, por lo que es difícil lograr más de aproximadamente 10 fotogramas por segundo más o menos. Llegar a los 24 fotogramas por segundo más o menos necesarios para el video, nuevamente, agregaría muchos gastos con poco beneficio. Por lo tanto, en el modo de película, el obturador físico permanece abierto, y la cámara utiliza un obturador electrónico, y una vez que lo hace, los artefactos de la lectura línea por línea desde el sensor a la memoria pueden hacerse visibles.