DataStage es una herramienta ETL que permite crear y mantener fácil y rápidamente almacenes de datos procedentes de sistemas de Aplicaciones Empresariales incluyendo SAP, Siebel, Oracle y PeopleSoft CRM y de otros sistemas relacionados al negocio.
Datastage soporta la extracción, integración y transformación de altos volúmenes de datos desde estructuras simples hasta muy complejas. Entre funciones de DataStage, la más destacada es el diseño de tareas que extraen, integran, agregan, cargan y transforman los datos para el Data Warehouse o Data Mart. Las tareas son compiladas para crear ejecutables que son calendarizados por el Director y ejecutadas por el Servidor.
Historia Datastage
Antes el producto se llamaba Ardent DataStage, luego adquirido por Ascential y en 2005 lo compró IBM. Desde entonces su nombre oficial es IBM WebSphere Datastage.
Componentes de DataStage
Hay cuatro componentes principales de la herramienta Datastage:
1. .Administrator – Interfaz de usuario usada para configurar proyectos de
Datastage y usuarios. Gestiona administración de proyectos de DataStage en
ambientes de desarrollo y producción.
2. Designer – usada para crear, diseñar y compilar tareas Datastage (también
permite testear y ejecutar). Mayormente usado por los desarrolladores.
3. Director – para validar, calendarizar, testear, ejecutar y monitorizar jobs
Datastage. Usado por los operadores y los testers.
4. Manager – interfaz de usuario usada para visualizar y editar el contenido del
repositorio.
Diseño de las tareas – Datastage palette
1. Datastage Server Palette – Los stages generales
2. Datastage Server Palette – Los stages de fichero
3. Datastage Server Palette – Los Stages de Base de Datos
4. Datastage Server Palette – Los Stages de Transformar y Filtrar
5. Datastage Server Palette – Elementos de Secuencias
6. Ejemplo de Job que carga datos de un archivo de texto, a otro archivo de texto
Fuente: http://etl-tools.info/es/datastage/curso_datastage.htm