El proyecto Censo 2001 abre caminos hacia el futuro

El INE ha invertido cerca de 2.000 millones de pesetas en su proyecto para la confección de los Censos de Población y Vivienda 2001. Una arquitectura de sistemas que integra conceptos de TI en almacenamiento, gestión documental e Internet.

Publicado el 15 Ene 2002

89960_44

Los Censos de Población y Vivienda, como los que se están realizando en 2001, son la operación de mayor magnitud e importancia para el sistema estadístico nacional, dado que determinan los parámetros fundamentales de los edificios, locales, viviendas y población residente en el conjunto del país, y para cada uno de sus ámbitos territoriales y administrativos, suministrando información válida para toda una década.

Por el volumen de información manejada, el número de personas y organismos implicados y los requisitos de tiempo, la elaboración de estos censos requiere la utilización intensiva de tecnologías de la información y de comunicaciones avanzadas. Una arquitectura de sistemas que se lleva analizando desde hace varios años y que posibilitará, según José Antonio Perea, coordinador general del proyecto Censos 2001 encuadrado en la subdirección general de Informática Estadística del Instituto Nacional de Estadística (INE), realizar en tres meses el trabajo que hace diez años nos llevó casi dieciocho meses de ejecución. La infraestructura tecnológica que hemos diseñado lo permite y los sistemas de almacenamiento que hemos elegido son un factor clave para conseguirlo, ya que manejaremos un volumen total de datos de 25 Tbytes.

Los principales condicionantes del proceso informático de producción censal en el proyecto 2001 pasan por el tratamiento de 60 millones de cuestionarios; el reconocimiento inteligente de caracteres (ICR) manuscritos y marcas en diferentes idiomas; la utilización de 100 millones de imágenes digitalizadas de los cuestionarios para realizar los procesos de gestión documental de producción y postproducción, y la criticidad de los tiempos, ya que se emplearán tan sólo tres meses hasta la finalización del proyecto. Sin contar con que este año se ha incorporado la vía Internet como un canal más de acercamiento al ciudadano.

Las empresas que participan como suministradores de servicios, suministros y arrendamientos de equipos, y que han sido seleccionadas en diferentes concursos que arrancaron hace tres años, son Fujitsu-Siemens, Odec, Atento, Siemens, EMC², Microsoft, y Kodak para la gestión documental de los cuestionarios en papel, y la UTE de Telefónica e Indra encargada del proyecto Internet. Este proyecto tecnológico está valorado en 2.000 millones de pesetas, de los cuales la mitad se ha dedicado a la adquisición de sistemas.

Para realizar el censo, el INE ha creado un Centro de Producción situado en San Fernando de Henares (Madrid), en el que más de 800 personas trabajarán en la tareas de explotación de los datos remitidos desde 500 oficinas comarcales distribuidas por todo el territorio nacional, que concentrarán a su vez los cuestionarios recogidos por cerca de 40.000 agentes censales. Según Perea, el proyecto de producción censal no es sólo el mayor de almacenamiento y gestión documental avanzada realizado en España hasta el momento, sino que podemos asegurar que a nivel mundial no existe un proyecto de gestión documental que debido a su criticidad en tiempos, volúmenes de información y los elementos de seguridad incorporados.
Las unidades de almacenamiento masivo de que dispone el INE para este proyecto tienen una capacidad de 25 Tbytes (lo que equivale a 25.000 colecciones de la Enciclopedia Británica) y están dotadas de las medidas de seguridad más avanzadas que existen hasta el momento, gracias a la utilización de discos espejo, arquitecturas clúster y la utilización de fibra óptica en un entorno de Red de Área de Almacenamiento (SAN).

Tal capacidad se requiere para realizar el almacenamiento de las imágenes digitalizadas y la explotación de la información recogida a través de procesos de reconocimiento óptico de caracteres -generado por el sistema Bellview Scan de la empresa Pulsar Train-, y la aplicación desarrollada por la compañía española Odec para el control y depuración estadística de los datos obtenidos a través de las imágenes, asegura Perea.

Para llevar a cabo esta ingente tarea, el proyecto Censo 2001 se decidió por la adquisición de dos sistemas de almacenamiento centralizado de última generación Symmetrix 8430 de la empresa EMC², con 140 discos (72 y 68, respectivamente) de 181 Gbytes (25 Tbytes en total) y cada uno de ellos con cuatro puertos de fibra FC_SW.

Entre los criterios de evolución y cambio se valoraron el soporte de todas los entornos de sistema operativos del mercado (OS/390, Unix, Microsoft, Novell y Linux), la posibilidad de reciclar las plataformas para centro remoto de recuperación de desastres, el soporte de SAN/NAS/DAS sobre el mismo sistema Symmetrix y la integración vía API con las grandes herramientas del mercado como Tivoli, Legato, Oracle, Veritas, productos de data warehousing y otras.

La arquitectura SAN integra diferentes sistemas y entornos para la gestión documental avanzada y la distribución de procesos de manera centralizada.

Los servidores de cuatro y ocho vías en configuración clúster cuentan con procesadores Xenon a 700 MHz, con 2 Mbytes de memoria caché y 3 de RAM, que corren bajo sistema operativo Windows 2000 Advance Server, una de las decisiones que más tiempo llevó a los responsables del proyecto valoramos todas las posibilidades, desde trabajar con un único entorno, hasta hacerlo con una mezcla de varios y nos decidimos por el primer camino. Tanto nuestro sistema de reconocimiento óptico de caracteres, como el de digitalización de imágenes trabajan con los sistemas de Microsoft y por otra parte estudiamos algunas instalaciones que operaban en entornos Windows con grandes volúmenes de datos y, hasta la fecha, no hemos tenido ningún problema.

Como elemento fundamental del sistema de producción, Censo 2001 dispone de los 12 primeros sistemas de digitalización de alta producción Kodak i810 instalados en Europa, que permiten un procesamiento de la imagen en tiempo real.
La arquitectura de comunicaciones del Censo 2001 viene determinada de una parte por los sistemas disponibles en el INE, tanto en sus servicios centrales como en sus delegaciones provinciales y, de otra, por las contrataciones de los servicios para la cumplimentación de los censos vía Internet y la comunicación telefónica de las 500 oficinas comarcales distribuidas por todo el territorio nacional con el propio Instituto Nacional de Estadística.

Para garantizar que los intercambios de información se realicen con las debidas condiciones de seguridad, optimizando al mismo tiempo la confidencialidad de la información en el caso de ficheros con datos de caracter personal, se ha definido una extranet entre las oficinas comarcales y el INE, que se ha denominado Red Privada de los censos (RPC) y que consta de los sistemas de comunicaciones del propio Instituto, complementados con un conjunto de redes locales en cada una de las oficinas comarcales las comunicaciones entre dichas redes darán servicio tanto a voz como a datos a través de telefonía móvil, pasando siempre por los servicios centrales del INE, explica José Antonio Perea.

El proyecto Censo 2001 permite que el conjunto de la población española pueda realizar el censo por Internet, convirtiéndose en una iniciativa pionera a escala mundial. Con la colaboración de Telefónica e Indra, adjudicatarios del concurso para la integración de esta parte del proyecto, se ha logrado superar lo conseguido por otros censos como los llevados a cabo en Singapur, Estados Unidos o Suiza, donde la posibilidad de utilizar la vía Internet quedó reducida a una parte de la población o a determinados territorios. Pensamos que esta experiencia será vital para el censo del 2011, fecha en la seguramente Internet se habrá convertido en el canal preferido de comunicación con la Administración para la mayoría de la población.

El entorno tecnológico propiciado por los integradores se basa en servidores web soportados en máquinas de SUN y un motor de bases de datos basado en Oracle. Se ha establecido un cuestionario censal con un mecanismo de firma electrónica avanzada para que el usuario pueda modificar sus datos padronales, en el caso de que haya detectado un error en los datos preimpresos.

Atento es la empresa encargada de gestionar el centro de atención telefónica para responder cualquier pregunta tanto sobre los cuestionarios en papel como sobre Internet. Hemos intentado no dejar ningún cabo suelto en un proyecto faraónico que sobrepasa todo cuanto se ha realizado hasta la fecha en producción censal, afirma Perea.

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

R
Redacción RedesTelecom

Artículos relacionados