Ah, esta pregunta. Primero, permítanme decir que trabajo para una empresa de validación de direcciones, SmartyStreets, pero intentaré ser objetivo.
Los datos de geocodificación de EE. UU. Generalmente provienen de dos fuentes básicas, GRATIS y CAROS. Vamos por un momento.
Los datos de geocodificación gratuitos provienen de la Oficina del Censo de EE. UU. Algunos le dirán que proviene del USGS o incluso del USPS, pero la fuente raíz es la Oficina del Censo de los EE. UU. Tienen un conjunto de datos bastante completo de coordenadas de segmento de calle, llamado datos TIGRE. Los datos de TIGER están disponibles gratuitamente para su descarga (aunque se necesita MUCHA manipulación para que sea utilizable). El USPS ha intentado vincular los datos del TIGRE y asignarlos a los códigos postales (que NO son límites geopolíticos, sino áreas de entrega basadas en el USPS). Existen muchos servicios diferentes que utilizan estos datos TIGER como fuente de geocoordenadas. Usan diferentes algoritmos para determinar la posición de una dirección a lo largo de un segmento de calle y luego interpolan el geocódigo basado en ese algoritmo. Debido al menor costo de los datos y los costos de licencia de los datos de origen (gratuitos), muchos servicios permitirán a los clientes almacenar los datos de geocodificación que forman parte de los datos de salida. SmartyStreets es uno de los que cree que puede hacer lo que quiera con los datos.
Los datos de geocodificación no gratuitos provienen de varias fuentes costosas. Estas fuentes generalmente compilan sus propios datos, aunque también aumentan esos datos con datos con licencia de otras fuentes también. Tiene fuentes como googlemaps, nokia, navteq, bing maps, yahoo, mapquest ... (Sí, lo sé, algunos de estos son propiedad de los demás). Sus datos son mucho más caros de adquirir y su licencia generalmente prohíbe a los clientes de almacenar los datos de respuesta.
Por lo tanto, tiene datos fuente gratuitos y datos fuente caros. Por lo general, ese costo se transfiere en forma de licencias más restrictivas. Espero que ayude.
Aquí hay una breve lista de proveedores que sí permite almacenar los datos de salida (ciertamente hay más):
geocod.io smartystreets.com yaddress.net
Por cierto, soy yo quien hizo la tabla a la que se hizo referencia en la publicación original. Trabajo con datos de direcciones todo el día en SmartyStreets.
--update-- @zsero En realidad, creo que datos similares a los disponibles en la Oficina del Censo de EE. UU. están disponibles en varios países. Australia, por ejemplo, así lo he escuchado. Sin embargo, no es necesariamente el país del que provienen los datos, sino el nivel de precisión. Los datos de la Oficina del Censo de los Estados Unidos, por ejemplo, proporcionan coordenadas geográficas bastante precisas para segmentos de calles, pero no para direcciones. La interpolación de direcciones desde ese segmento de calle (punto inicial o final de la calle) a lo largo del archivo de forma que designa la forma de la calle es lo que permite "adivinar" dónde podría estar la dirección a lo largo de la calle. Eso es bastante bueno para el análisis estadístico. Sin embargo, para algo como el paracaidismo de precisión o un ataque con misil quirúrgico, eso no sería lo suficientemente bueno. Desearía datos de geocodificación en el nivel de la azotea. TípicamenteEsa es la diferencia entre los datos gratuitos y los costosos.