5 Gestión y manipulacion de datos
BarbWin, TESI, Proceso de datos
Conjunto de utilidades cuya función es modificar los datos actuales obteniendo nuevas variables, ficheros o subficheros.
5.1 Combinar datos
Funcionalidades que permiten crear nuevos ficheros a partir de diferentes aproximaciones.
5.1.1 Unir ficheros
Funcionalidad que permite unir (acumulando, vertical) archivos de datos con estructura semejante en parte. Se usa mucho para acumular olas, o diferentes períodos de una misma medición.
5.1.2 Fusionar
Funcionalidad que permite fusionar ficheros (en horizontal) archivos de datos a partir del nexo común de una o más variables que debe tomar el mismo valor en los diferentes ficheros. Las variable pueden llamarse de diferente nombre, pero deben ser emparejadas en la sintaxis.
5.1.3 Crear subfichero
Funcionalidad que permite crear un fichero nuevo a partir de diferentes secciones con una estructura fija de un fichero original. Es asimilable a generar un format long a partir de un format wide.
5.1.4 Recrear fichero
Funcionalidad inversa de la anterior, permite crear un fichero en format wide a partir de un fichero en format long. Se requiere de una variable que genera los grupos denominada pivote.
5.2 Calcular
Conjunto de utilidades cuya función es la de crear nuevas variables numéricas a partir de las ya existentes en el fichero o de realizar sofisticados cálculos condicionados con la información actual.
5.2.1 Calcular valor
Cálculo de variables a partir de condiciones. Se pueden encadenar varios cálculos y se ejecutan una a una de forma secuencial. Hasta que no acaba una operación (todos los registros, no comienza otra).
5.2.2 Calcular valor en grupos de registros
Agrupa las variables y realiza los cálculo de variables dentro del grupo: sumas, máximos, casos, etc…
5.2.3 Calcular subgrupos
Agrupa las variables y realiza los cálculo de variables dentro del subgrupo: sumas, máximos, casos, etc…
5.2.4 Valores perdidos (asignar)
Funcionalidad que intenta asignar un valor a un valor perdido del sistema. Usa el método directo y/o el método de regresión lineal mútiple.
5.3 Reemplazar
Conjunto de utilidades cuya función es crear o modificar la información actual de las variables de un fichero de cualquier tipo.
5.3.1 Reemplazar valores
Funcionalidad que cambia, reemplaza un valor por otro. Muy importante su uso en las múltiples.
5.3.2 Sustituir valores
Funcionalidad que cambia, reemplaza un valor especial (NS,NC NDef o vacío) por otro.
5.3.3 Reemplazar por acumulación
Funcionalidad que cambia, reemplaza un valor por otro añadiendo o no de forma condicionada al valor actual. Muy importante su uso en las múltiples.
5.3.4 Reemplazar texto
Funcionalidad que reemplaza texto por texto.
5.3.5 Eliminar HTML
Funcionalidad que limpia de etiquetas código HTML los textos de una variable: texto extra /y/o códigos.
5.4 Otras funciones
Conjunto de funciones que condicionan los cálculos o su forma de ejecutarse.
5.4.1 Filtrar
Seleccionar un conjunto de datos para proceder con diferentes procesos posteriores. Usar las condiciones (Section 18.4) con sus operadores lógicos (Section 18.5) o aritméticos (Section 18.6) y las funciones (Section 18.7) o expresiones (Section 18.8) del programa.
5.4.2 Ponderar
Funcionalidad que aplica un coeficiente de ponderación almacenado en una variable o expresión aritmética de variables registros aregistro modificando el valor por defecto de ponderación que es 1.
5.4.3 Equilibrar
Funcionalidad que permite el cálculo de coeficientes de ponderación por los dos métodos tradicionales:
- Directa, variable a variable con proceso iterativo usando las variables de forma unitaria
- Cruzada o combinada, asignando coeficientes de ponderación a las diferentes combinaciones o cruces que se producen entre las variables de cálculo.
5.4.4 Eliminar registros
Funcionalidad que permite eliminar registros (filas) d ela tabla de datos a partir de una condición de tipo lógico o aritmético.
5.4.5 Depurar
Funcionalidad que depura, limpia o deja consistente una variable a partir de condiciones que se establecen en el flujo del fichero.
5.4.6 Reordenar variables
Funcionalidad que reordena las variables en el archivo de datos.
5.4.7 Listar
Funcionalidad que lista variables con resúmenes de datos.