5  Gestión y manipulacion de datos

Keywords

BarbWin, TESI, Proceso de datos

Conjunto de utilidades cuya función es modificar los datos actuales obteniendo nuevas variables, ficheros o subficheros.

5.1 Combinar datos

Funcionalidades que permiten crear nuevos ficheros a partir de diferentes aproximaciones.

5.1.1 Unir ficheros

Funcionalidad que permite unir (acumulando, vertical) archivos de datos con estructura semejante en parte. Se usa mucho para acumular olas, o diferentes períodos de una misma medición.

5.1.2 Fusionar

Funcionalidad que permite fusionar ficheros (en horizontal) archivos de datos a partir del nexo común de una o más variables que debe tomar el mismo valor en los diferentes ficheros. Las variable pueden llamarse de diferente nombre, pero deben ser emparejadas en la sintaxis.

5.1.3 Crear subfichero

Funcionalidad que permite crear un fichero nuevo a partir de diferentes secciones con una estructura fija de un fichero original. Es asimilable a generar un format long a partir de un format wide.

5.1.4 Recrear fichero

Funcionalidad inversa de la anterior, permite crear un fichero en format wide a partir de un fichero en format long. Se requiere de una variable que genera los grupos denominada pivote.

5.2 Calcular

Conjunto de utilidades cuya función es la de crear nuevas variables numéricas a partir de las ya existentes en el fichero o de realizar sofisticados cálculos condicionados con la información actual.

5.2.1 Calcular valor

Cálculo de variables a partir de condiciones. Se pueden encadenar varios cálculos y se ejecutan una a una de forma secuencial. Hasta que no acaba una operación (todos los registros, no comienza otra).

5.2.2 Calcular valor en grupos de registros

Agrupa las variables y realiza los cálculo de variables dentro del grupo: sumas, máximos, casos, etc…

5.2.3 Calcular subgrupos

Agrupa las variables y realiza los cálculo de variables dentro del subgrupo: sumas, máximos, casos, etc…

5.2.4 Valores perdidos (asignar)

Funcionalidad que intenta asignar un valor a un valor perdido del sistema. Usa el método directo y/o el método de regresión lineal mútiple.

5.3 Reemplazar

Conjunto de utilidades cuya función es crear o modificar la información actual de las variables de un fichero de cualquier tipo.

5.3.1 Reemplazar valores

Funcionalidad que cambia, reemplaza un valor por otro. Muy importante su uso en las múltiples.

5.3.2 Sustituir valores

Funcionalidad que cambia, reemplaza un valor especial (NS,NC NDef o vacío) por otro.

5.3.3 Reemplazar por acumulación

Funcionalidad que cambia, reemplaza un valor por otro añadiendo o no de forma condicionada al valor actual. Muy importante su uso en las múltiples.

5.3.4 Reemplazar texto

Funcionalidad que reemplaza texto por texto.

5.3.5 Eliminar HTML

Funcionalidad que limpia de etiquetas código HTML los textos de una variable: texto extra /y/o códigos.

5.4 Otras funciones

Conjunto de funciones que condicionan los cálculos o su forma de ejecutarse.

5.4.1 Filtrar

Seleccionar un conjunto de datos para proceder con diferentes procesos posteriores. Usar las condiciones (Section 18.4) con sus operadores lógicos (Section 18.5) o aritméticos (Section 18.6) y las funciones (Section 18.7) o expresiones (Section 18.8) del programa.

5.4.2 Ponderar

Funcionalidad que aplica un coeficiente de ponderación almacenado en una variable o expresión aritmética de variables registros aregistro modificando el valor por defecto de ponderación que es 1.

5.4.3 Equilibrar

Funcionalidad que permite el cálculo de coeficientes de ponderación por los dos métodos tradicionales:

  • Directa, variable a variable con proceso iterativo usando las variables de forma unitaria
  • Cruzada o combinada, asignando coeficientes de ponderación a las diferentes combinaciones o cruces que se producen entre las variables de cálculo.

5.4.4 Eliminar registros

Funcionalidad que permite eliminar registros (filas) d ela tabla de datos a partir de una condición de tipo lógico o aritmético.

5.4.5 Depurar

Funcionalidad que depura, limpia o deja consistente una variable a partir de condiciones que se establecen en el flujo del fichero.

5.4.6 Reordenar variables

Funcionalidad que reordena las variables en el archivo de datos.

5.4.7 Listar

Funcionalidad que lista variables con resúmenes de datos.