3  Gestión y manipulacion de ficheros

Keywords

BarbWin, TESI, Proceso de datos

3.1 Introducción

Son diferentes las operaciones que se pueden realizar con el programa. Algunas de ellas tiene carácter básico y otras más complejo. Con carácter básico tenemos:

  • Abrir estudio
  • Guardar estudio
  • Modificar estudio
  • Eliminar estudio
  • Importar datos de otros formatos
  • Exportar datos a otros formatos

En los siguientes apartados iremos desarrollando cada una de estas entradas.

3.2 Abrir

Vamos ahora a abrir la tabla de variables que acabamos de guardar. Para ello desde la opción inicio >> Abrir aparece un cuadro de diálogo con los distintos trabajos existentes en la carpeta del programa. Este cuadro de diálogo incluye las opciones típicas de copiar, renombrar y crear nuevas carpetas pulsando botón derecho del ratón. Una vez seleccionado el fichero se abren las dos ventanas típicas. La ventana de tabla de variables tendrá las variables que hemos definido, la tabla de datos tendrá en cabecera de las columnas los nombres de las variables de la base de datos y en filas los datos. En este momento si no queremos ir a modificar ninguna de las variables ya existentes (bastaría con hacer doble clic sobre cualquiera de ellas) o añadir alguna más (bastaría con <Archivo – Definir variable> o hacer clic en cualquiera de las existentes e ir al final para añadir nueva) estamos en disposición de continuar con la introducción de los datos.

3.3 Guardar

Una vez diseñada la tabla de variables, y en este caso también con la tabla de datos, llega el momento de guardar nuestro trabajo. Es posible que si hemos estado mucho tiempo para redactarla, nos haya solicitado de forma automática un nombre; esto es debido al auto guardado automático. Como en todos los programas de Windows, en el menú existe la opción inicio >> Guardar y también inicio >> Guardar como…. Utilice la primera de ellas y dé usted el nombre que desee al archivo. Le recordamos la ausencia de necesidad de establecer la extensión del mismo. .

3.4 Abrir datos de otros formatos

Gandia BarbWin da al usuario la posibilidad de abrir y guardar los ficheros desde /como archivos de tipo ASCII delimitados o no delimitados y otros formatos. En cualquier caso la forma de elegir estas opciones será desde la opción de menú inicio >> abrir >> seleccionar tipo de archivo, eligiendo en el cuadro desplegable de tipos de archivo la opción deseada.

3.4.0.1 Estudios Barbwin 7 (gbw7)

Apertura directa y transformación a formato Barbwin 8.

3.4.0.2 Estudios integra (gbx)

Apertura directa y transformación a formato Barbwin 8.

3.4.0.3 Abrir / Guardar un fichero ASCII delimitado

Si elegimos la opción de ficheros tipo texto (extensiones de archivo *.txt, *.doc, *.dat, *.csv) nos aparecerá un cuadro de importación en el que podremos definir las opciones en las que se encuentra el fichero texto a importar. Opciones como si el fichero viene como DOS o viene como Windows, si los campos de texto están entrecomillados o no lo están, opciones sobre cualquier separador que se haya podido utilizar, si el fichero viene con los nombres de las variables o no, etc.

Como podemos observar, en el cuadro están implícitas todas las opciones del fichero texto para poder ser importado. El usuario elige las convenientes y puede, en la rejilla inferior, ver si el fichero va adecuándose bien a la tabla de datos. Esta pequeña tabla de datos, sólo representa los 100 primeros registros que encuentra del fichero a abrir. Una vez abierto el fichero, el programa intenta reconocer las variables abiertas y les asigna tipo y formato, el usuario puede necesitar variar el tipo de variable para alguna de ellas. Están permitidos los cambios que no afecten a la estructura de los datos.

De la misma forma que se puede abrir un fichero de tipo texto, también se puede guardar un fichero para ser utilizado por otros programas. En este caso la opción de menú que se utiliza es <Archivo – Guardar como>. Aconsejamos que se realice una copia del fichero a guardar como texto, en formato Gandia BarbWin (*. gbw del programa), ya que de otra forma el usuario perderá todas las definiciones de códigos, controles, saltos y bases que haya definido.

Para guardar el fichero como texto delimitado volvemos a encontrar el mismo diálogo que en Abrir, dónde el usuario decidirá bajo qué forma quiere guardar el fichero.

Destacar que en esta forma de guardar el fichero, las variables de tipo múltiple, se almacenan en el fichero texto como tantas variables categóricas de tipo lógico y binario (0/1), como códigos definidos por el usuario tiene.

Por ejemplo, si tenemos una variable de tipo múltiple llamada P1, con cuatro códigos definidos 1, 2, 3, 4, y con este formato en Gandia BarbWin:

REGISTRO MÚLTIPLE
1 2;4
2 1;2;3;4
3 2;3

una vez exportada la variable, en el fichero texto encontraríamos:

REGISTRO P1 – 1 P1 – 2 P1 – 3 P1 – 4
1 0 1 0 1
2 1 1 1 1
3 0 1 1 0

es decir figuraría un 1 cuando se cita el ítem correspondiente a la múltiple y un 0 cuando no se cita. El fichero resultante puede ser abierto por cualquier otro programa para seguir realizando análisis de la información que contiene. En cada programa se abrirá según las especificaciones del mismo.

3.4.0.4 Abrir ficheros de texto en columnas (sin delimitador)

En muchas ocasiones disponemos de ficheros ASCII, pero sin ningún tipo de separador entre las variables. El usuario conoce las posiciones o columnas que ocupan cada una de las variables y para proceder a su importación, se debe crear una estructura muy sencilla, que no tiene porque ser del fichero completo, sino sólo aquellas columnas que se deseen leer. El fichero que contenga los datos deberá tener extensión *. txt y el fichero que contenga la estructura deberá tener extensión *. str. Ambos deben estar en texto plano. En la estructura se definirá:

  • Nombre de la variable (necesario)
  • Columnas que ocupa (necesario)
  • Tipo de variable (necesario)
  • C si es de categoría
  • M si es múltiple (se supone que de tipo cadena donde los valores se separan por el separador de listas de Windows)
  • NM si es numérica métrica
  • NO si es numérica ordinal
  • A si es alfanumérica
  • F si es fecha
  • H si es hora
  • Listado de códigos (a partir de la columna 2 del fichero texto)

Tanto fecha como hora deben estar en formato de 10 dígitos y con el separador que utilice Windows para ello. Lo normal es utilizar la / para fechas y el símbolo: para horas.

Por ejemplo si el fichero texto fuera:

10000112/12/198712: 00: 00GLORIA MARQUES 12345

el texto de la estructura sería:

SEXO=1=C COLORES=2_6=M FECHA NACIMIENTO=7_16=F HORA NACIMIENTO=17_25=H NOMBRE=26_46=A VALOR =47_51=NM La estructura BÁSICA correspondiente sería la del cuadro anexo. Sin embargo podríamos complementar esta estructura básica con listados de códigos para que fueran reconocidos por el programa. SEXO=1=C Hombre=1 Mujer=2 COLORES=2_6=M Rojo=1 Verde=2 Amarillo=3 Azul=4 Rosa=5 FECHA NACIMIENTO=7_16=F HORA NACIMIENTO=17_25=H NOMBRE=26_46=A VALOR =47_51=NM

La mejor forma de conocer como funciona esta estructura es guardar cualquiera de los ficheros entregados como prueba con estructura y ver como queda reflejado.

Variables múltiples en *.str

Las múltiples de un fichero texto pueden ser reagrupadas en una sola variable de tipo múltiple en el fichero Gandia BarbWin o pueden ser tratadas de forma individual como si fueran variables dicotómicas.

SEXO=1=C HOMBRE=1 Mujer=2 ROJO=2=C Sí=1 No=0 VERDE=3=C Sí=1 No=0 AMARILLO=4=C Sí=1 No=0 AZUL=5=C Sí=1 No=0 ROSA=6=C Sí=1 No=0 FECHA NACIMIENTO=7_16=F HORA NACIMIENTO=17_25=H NOMBRE=26_46=A VALOR =47_51=NM

En nuestro ejemplo hemos preparado la estructura para que fuera una variable múltiple. Si quisiéramos que fueran de categoría. A la hora de guardar el fichero con estructura, (desde Guardar como…), la pregunta de como guardamos las múltiples, hace referencia a si las podemos guardar como variables de tipo binario o lógico (0/1), o como variables alfanuméricas.

Si modificamos los nombres de las variables que forman la múltiple y lo sustituimos por lo siguiente:

SEXO=1=C HOMBRE=1 Mujer=2 XX_1=2=C Sí=1 No=0 XX_2=3=C Sí=1 No=0 XX_3=4=C Sí=1 No=0 XX_4=5=C Sí=1 No=0 XX_5=6=C Sí=1 No=0 FECHA NACIMIENTO=7_16=F HORA NACIMIENTO=17_25=H NOMBRE=26_46=A VALOR =47_51=NM

El programa automáticamente detectará que el conjunto formado por XX_1 hasta XX_5 forman una múltiple. Detecta esto porque son binarias, tienen una misma raíz común en el nombre, y van correlativas.

Detección de múltiples en importaciones

Cuando importamos la base de datos el sistema puede llegar a reconocer la existencia de variables que para Gandia BarbWin puedan ser tratadas como múltiples. Se solicitará al usuario confirmación, y si ésta es afirmativa, se presenta una tabla en la que se pueden estudiar las binarias que el programa reconoce y elegir aquellas variables a transformar automáticamente. Dos son los criterios que el programa utiliza para el reconocimiento de múltiples en archivos de bases de datos:

  • Que las variables sean de tipo binario
  • Que las variables tengan la siguiente estructura de nombre: Nombre de Variable_X.

Por ejemplo las variables P1_1, P1_2, P1_3 Y P1_4 si fueran binarias (0/1) y estuvieran correlativas en el fichero se reconocerían como una variable llamada P1 de tipo múltiple.

3.4.0.5 Abrir Excel (*.xls / *.xlsx)

Permite abrir hojas de cálculo, definiendo un rango de celdas. Sin embargo en ocasiones es necesario abrir desde EXCEL un archivo multihoja (derivado del límite de columnas y filas de EXCEL en una hoja). Para ello se puede optar por el nuevo método de carga, donde se definen qué hojas contienen variables y qué hojas contienen datos.

En este segunda opción, debe desactivarse la selección de rango a importar y debe indicarse mediante el botón qué hojas contienen los nombres (cabeceras) de variable.

Para ello, se deben organizar las hojas tomando como modelo la matriz que resultará tras la importación como se puede observar en la imagen, de formas que las hojas de la parte superior contengan los nombres de las variables a crear (y también por supuesto datos) mientras que las inferiores contienen los registros de datos que exceden de 65000.

Se deben identificar cuáles son las hojas que contienen los nombres de las variables y la matriz de hojas ha de ser simétrica para todos los conjuntos de variables en cuanto a número de registros.

3.4.0.6 Abrir SPSS (SAV)

Seleccionar el archivo sav y cargar el mismo utilizando las facilidades que ofrece SPSS Inc para la carga de archivos en su formato. Necesarios disponer de versión 7.2 al meonos de Gandia BarbWin.

3.5 Guardar a otros formatos

BarbWin permite guardar como:

  • ASCII Columnado (str + txt)
  • ASCII Delimitado
  • MS Excel (xlxs)
  • Sintaxis de sps (sps + dat)
  • SAV de SPSS

Cada uno de estos formatos debe ser abierto con sus características en el programa correspondiente.

3.5.1 Exportación a EXCEL / SPSS de las múltiples

Desde las propiedades del estudio, se puede fijar la forma en que se exportarán las múltiples.

  • Como cadena (sin transformación)
  • Como binaria
  • Con menciones

Decide la que mejor se adapte a tu necesidad.