2 Iniciando Barbwin 8
BarbWin, TESI, Proceso de datos
Barbwin 8 es una versión intermedia de transición entre BarbWin 7 y lo que será la nueva familia de software de la empresa TESI, la familia Hive.
Este software conserva la parte clásica de Barbwin 7 de gestión de procesos necesarios para la explotación de los datos y la parte de tabulación clásica, pero se ha iniciado la transición de procesos de análisis a trabajar con nuevas tecnologías como R y Python, lo que va a permitir avanzar en procesos relacionados con automatización, aplicación de inteligencia artificial entre otros. De la misma forma, es una transición hacia una nueva forma de ver el proceso de datos más orientado a trabajar con publicaciones directas y ágiles en Internet. Esta ayuda, permite al usuario conocer la referencia de cada una de las funcionalidades de la aplicación y como se comporta Barbwin ante las peticiones de análisis del usuario.
Estamos delante de Barbwin. Suponemos que está instalado y lo hemos ejecutado. Nos encontramos ante una pantalla vacía, que llamamos escritorio. Antes de adentrarnos en ella, hagamos un breve recordatorio de qué es un fichero de datos. Aunque estamos seguros de que muchos de vosotros nunca usaréis esta parte de creación de archivos, porque vuestras fuentes de datos son externas, hagamos un breve ejercicio de memoria recordando los datos personales de nuestros amigos o compañeros de trabajo; estos datos los escribiremos en un papel siguiendo una estructura lógica. De cada amigo nos gustaría conocer su nombre, apellidos, dirección, código postal, población y teléfono. Escribir en papel estos datos, implica reflexionar sobre cual será la mejor forma de grabarlos.
En la terminología que se utiliza en las bases de datos tenemos tres palabras que definen términos de gran importancia:
- Variable o campo, cada uno de los tipos de información que se van a usar. Se corresponde con una columna de la tabla anteriormente expuesta. Utilizamos indistintamente esta nomenclatura. En términos informáticos se aplica más la palabra campo cuando se está hablando de bases de datos y variable cuando se está hablando de proceso de datos.
- Registro, se corresponde con una fila de la tabla anterior y se define como el conjunto de datos de una unidad en particular.
- Dato, la intersección entre variable y registro, es decir una celdilla de la tabla anterior.
Si comprendes estos tres términos ya podemos comenzar el fácil – esperamos – camino hacia el tratamiento de la información. A lo largo de este capítulo, daremos una breve descripción de cada una de las partes que conforman el escritorio de BarbWin:
- Escritorio y menú
- Estudios, ficheros y ventanas
2.1 Escritorio
Cuando iniciamos el programa, y abrimos uno de los ficheros de ejemplo disponibles (carpeta datos de nuestro Barbwin) observamos que aparecen tres ventanas y un árbol (ver Figura 1). Una de las ventanas es titulada Resultados y será la ventana en la que se reflejarán algunos resultados (sólo aquellos que son específicamente textos). La segunda y tercera ventana representan la tabla de variables, es decir, la estructura y diseño de las variables también llamada tabla de variables y la tabla de datos.
En la zona izquierda de la ventana, aparece una barra de herramientas y un panel con distintas vistas de nuestro estudio (a él nos referiremos a partir de ahora como panel de vistas):
- Grupos (defecto)
- Variables
- Histórico de acciones sobre el estudio
- Ventanas abiertas en la aplicación
Como resultado de nuestro trabajo, iremos obteniendo más nuevas variables, cuadros, y contenido de resultados tanto de tablas como de gráficos. Los conoceremos en los distintos capítulos de este manual.
2.2 ¿Qué podemos hacer con BarbWin?
Las principales funciones que podremos realizar con BarbWin a nivel de creación de ficheros y variables
- Crear una tabla de variables, es decir definir campos o variables que van a intervenir y asignar las características esenciales de la misma.
- Crear una tabla de datos. Tras crear las variables, introducimos los datos (valores para cada variable) que posteriormente requeriremos para procesar los datos.
- Modificar la tabla de variables y / o la tabla de datos tantas veces como deseemos.
- Buscar datos concretos o que cumplan unas determinadas condiciones y analizarlos o modificarlos.
Si añadimos a ello el concepto de funcionalidad a nivel de proceso de datos:
- Clasificar y resumir las informaciones de la tabla de datos en tablas de resultados con frecuencias o con medidas estadísticas.
- Calcular nueva información a partir de los datos ya existentes.
Antes de todo ello, demos un repaso a la aplicacion, su estructura y ubiquemos cada característica.
2.3 Estructura de la aplicación
Con una estructura de aplicación estándar en Windows, Barbwin presenta la pantalla dividida en dos secciones. La sección de la izquierda está compuesta por una barra de herramientas que contiene las entradas fundamentales:
- Menú general;
- Opciones de sistema;
- Opciones de estudio;
- Navegador de variables / ventanas / grupos / ejecuciones;
- Salida de la aplicación.
En la parte derecha, se distingue una vista en la que localizamos tres pestañas:
- Tabla de datos
- Tabla de variables
- Editor de resultados
Desarrollemos cada una de ellas
2.3.1 Opciones de sistema
Opciones que determinan como el archivo / banco de datos / fichero / estudio (de todas estas formas nos referiremos a él) se comporta en las funcionalidades de la aplicación. Opciones por defecto para determinar como se comporta un estudio nuevo.
2.3.2 Opciones de estudio
Opciones que determinan como el archivo / banco de datos / fichero / estudio (de todas estas formas nos referiremos a él) se comporta en las funcionalidades de la aplicación. A diferencia de las de sistema, actúan desde que se modifican.
2.3.4 Tabla de datos
Tabla de doble entrada en la que las columnas son variables y las filas unidades de información.
2.3.5 Tabla de variables
Tabla de doble entrada en la que se listan las variables del estudio con su tipo y sus textos que la caracterizan. Es un resumen que se puede copiar y pegar. Es una de las ventanas que se abren al iniciar el programa y nos muestra una breve descripción del fichero (opcional) y los campos que están disponibles en el archivo que hayamos abierto para ser procesadas junto con una breve descripción de cada variable.
Sus utilidades u opciones son:
- Acceso a edición de variables, haciendo doble clic sobre una celdilla cualquiera de la tabla de variables o bien haciendo doble clic sobre la variable desplegada en el árbol, podemos entrar a diseñar las características y propiedades de una variable (nombre, tipo, formato, etc.).
- Obtención de un listado mediante copia al porta-papeles de los campos que componen una tabla de datos; muy utilizado para tener un map de nombre de variable, tipo y texto extra.
Estando situado en la vista de datos, se puede acceder a la edición de una variable o campo, haciendo doble clic sobre el nombre del mismo.
2.3.6 Editor de resultados
Nuevo centro de referencia en la actividad de análisis. Transición hacia la futura publicación directa de contenidos. Editor de HTML 5 embebido con nuevas funcionalidades que permiten combinar nuestra tarea de análisis y nuestra tarea de documentar esos resultados. Un camino amplio, abierto y con un futuro por completar. Mira la sección correspondiente a explicar su funcionamiento.
2.3.7 Menú general
Dedicamos un epígrafe completo a orientar las diferentes funciones del menú general.
Menú tradicional desde el que se inician las opciones de proceso de datos. Sus diferentes opciones son direccionadas desde aquí a su enlace correspondiente.
- Archivo Chapter 18
- Variables Chapter 18
- Datos Chapter 5
- Codificación Chapter 6
- Transformación Chapter 7
- Tabulación Chapter 10
- Análisis Chapter 8
- Herramientas Chapter 18
- Ayuda Chapter 18
2.4 Estudios, variables y datos
2.4.1 Estudios y variables
Vamos a desarrollar en este capítulo, todos los aspectos referentes a la gestión de los bancos de datos. Desde su creación, hasta su disposición final para el proceso de datos. Son innumerables las transformaciones que para la obtención de una explotación coherente y acorde con las expectativas debe realizarse.
- Crear y gestionar estudio
- Crear y gestionar variables
2.4.1.1 Crear estudio
Denominamos estudio a la colección de variables, sus características y los datos que las respaldan. En un plano conceptual un fichero de datos es una organización de columnas (variables) y filas (registros) que forman una unidad homogénea.
En nuestro sistema, el estudio se corresponde con el fichero de datos. es por ello que tras su creación, nuestra preocupación será la gestión de los componentes del mismo.
Para iniciar una base de datos nueva o también denominado estudio nuevo (o también, indistintamente, lo llamaremos fichero de datos), basta simplemente con hacer clic sobre menú >> archivo >> nuevo. Podemos atribuir un texto descriptivo a este nuevo trabajo que iniciamos. Una vez tenemos escrita la descripción, existen dos formas de continuar con el trabajo, dos formas que responden a una concepción distinta del trabajo e incluso responden a dos formas objetivas de interpretar este programa.
- Como hoja de cálculo. Un fichero de datos sería creado por medio de la tabla de datos donde, sin necesidad de definir las características de las variables, el usuario puede comenzar a registrar datos. Cada fila que se rellene en la tabla de datos será un registro y cada columna que se ocupe será una variable diferente con el nombre Var1 hasta Varxxx. Dependiendo del tipo de información que introduzca el usuario en las celdillas, el programa dará tipo a la columna, además de nombre, basándose siempre en la primera información que se introduce. Por ejemplo si en una variable el usuario introduce esta información 17/12/2001 el programa lo interpretaría como una fecha, y si por ejemplo graba 1;3;6 el programa lo interpretaría como una múltiple. A medida que accedamos a la edición de la celda y con INTRO aceptemos el contenido escrito, se crearía una nueva columna de información vacía. Utilizando la combinación May + Intro se abriría una nueva línea.
- Como base de datos. La primera de ellas sería iniciar un trabajo como es tradicional en los sistemas de base de datos, comenzar en la ventana de tabla de variables indicando nombre, tipo y formato de las variables con las que vamos a trabajar, para a continuación introducir los datos por medio del asistente de grabación.
Sea cual sea la forma de iniciar el trabajo, es nuestra misión dar a conocer cómo se realiza la creación de variables de ambas formas y también cómo se realiza la grabación de datos de ambas formas, ya que, comencemos por donde comencemos, al finalizar el diseño y la grabación o la grabación y el diseño, siempre tendremos un conjunto de variables y un conjunto de registros.
2.4.1.1.1 Niveles de medida
En el ámbito de la estadística, se denomina medición a la asignación de números a observaciones, de modo que los números sean susceptibles de análisis por medio de manipulaciones u operaciones de acuerdo con ciertas reglas. La teoría de la medición está formada por conjuntos de teorías diferentes y separadas, referidas cada una a un nivel de medición.
Las operaciones estadísticas permitidas con un conjunto de observaciones dependen del nivel de medida que se alcance. Cuatro serán los niveles de medida que desarrollemos para ubicar este tema:
- Nominal o cualitativo. Hablamos de un nivel de medición nominal cuando planteamos su escala de medición sobre la base de una mera asignación de nombres a los distintos valores que pueda tomar la misma. Es una escala de medición donde lo importante no son los valores numéricos sino su representación textual. Un ejemplo puede ser el datos sociodemográfico “sexo” cuyos valores a tomar serán hombre / mujer con independencia de que asignemos valores 1 y 2 ó también 99 y 2000. No es importante el valor codificado sino su representación. Decimos que en este nivel de medición hay una presencia de clasificación, pero hay una ausencia de orden y cuantificación. Éste es el nivel de medición más básico en las Ciencias Sociales.
- Ordinal. Hablamos de escala de medición de tipo ordinal, cuando ante un evento o variable planteamos su medida de forma que no sólo clasificamos, sino que incluimos un cierto orden entre las alternativas de respuesta a la variable. En la medición se aprecia un lineal entre las respuestas extremas. Por ejemplo, ante una pregunta sobre la capacidad que presenta un estudiante ante un simulador de negocios, las respuestas son: Mucha capacidad, 4; Bastante capacidad, 3; Algo de capacidad, 2; Ninguna capacidad, 1. Ante dos evaluaciones distintas a dos entrevistados sobre su nivel de capacidad, veríamos que si uno de ellos contesta la opción mucha capacidad y otro contesta la opción bastante capacidad, entre ellos hay una cierta idea de orden además de clasificación. No sabemos cuántas veces más es capaz el primer individuo que el segundo, pero sí sabemos que es más capaz.Este ejemplo hace que se vea más clara la diferencia entre las dos primeras escalas. En la escala nominal no importaba que hombre fuera en primer lugar o en segundo lugar, sin embargo en este segundo caso, sí es importante que mucha capacidad esté antes que bastante capacidad, y además que su valor sea el correspondiente en la relación. Por tanto, la escala ordinal es válida para clasificar y para ordenar, pero como dijimos al inicio es incapaz para cuantificar la relación.
- Intervalo. La escala de intervalo es un nivel de medición que poseyendo las características de las anteriores, podemos decir que aporta un cierto nivel de cuantificación a la medición. Sin llegar a ser una cuantificación absoluta, decimos que las variables medidas en escala intervalo permiten establecer relaciones con la medida utilizada, pero no de forma absoluta. Por ejemplo, las temperaturas son el exponente de este tipo de escalas. Podemos proporcionar mediciones en escalas diferentes (Celsius, Fahrenheit, Kelvin) y podemos transformarlas a un único patrón de medida. Otro ejemplo de este tipo de medición son las valoraciones que a menudo introducimos como por ejemplo el grado de satisfacción ante un servicio evaluado entre 0 y 5.
- Razón o métrico. Conocida también como nivel de medida proporcional, se refiere aquella medición más ambiciosa de todas las conocidas, puesto que clasifica, ordena y cuantifica, existiendo además un cero absoluto en la cuantificación. La propiedad esencial de esta escala de medida es la posibilidad de establecer “cuántas veces” es más un objeto que otro, por ejemplo, “cuántas veces” es más pesado A que B, “cuántas veces” es más alto el individuo x que el individuo y, etc. Constituyen por decirlo de alguna forma el nivel ideal de medida, pues su utilización implica clasificación, orden y cuantificación.
2.4.1.2 Crear variables
Conjunto de funciones relacionadas con la creación y gestión de las variables, unidad básica de información en un fichero de datos.
2.4.1.2.1 Categorías especiales
Un campo o variable puede tener variables cuya respuesta
- está planificada (precodificación)
- no está planificada, pero es conocida (especiales)
- no es planificada y es abierta En este apartado veremos las segundas, ya que las primeras serán explicadas al analizar toda la extensión del significado del concepto variable a lo largo de este capítulo.
Categorías especiales Existen cuatro tipos de valores perdidos o también llamados valores especiales:
Categoría de respuesta denominada No contesta
Categoría de respuesta denominada No sabe
Categoría de respuesta denominada Filtrado
Categoría de respuesta denominada No definida Estos valores que en otros programas suelen no estar identificados o incluso si tienen valor numérico, pueden perturbar el cálculo matemático de medias, desviaciones, etc. Reciben códigos especiales:
No contesta: representado por un &
No sabe: representado por un +
Filtrado: representado por un -
No definida: cualquier valor no incluido entre los códigos definidos para una variable. No tiene representación alguna, puede ser un blanco, puede ser nada (NULL) puede ser un 100, etc.
En este documento nos referiremos a estos valores como valores especiales y concretamente en las condiciones y en el texto de los ejemplos nos referiremos a ellos por sus valores.Se aconseja la utilización de esta simbología y no la utilización de valores métricos, ya que en ocasiones ante un despiste en el cálculo o un intercambio de datos, un valor 99 contemplado como un “no contesta” en una aplicación puede ser interpretado como valor válido en otra. En la parte de análisis de nueva formulación, esos valores especiales se transforman en la simbología NA.
2.4.1.2.2 Descripción de una variable
Cuando iniciamos el programa o bien pinchamos sobre el botón de Nuevo con la intención de crear un nuevo estudio, aparecen las ventanas de variables y datos vacías y el árbol en su configuración básica. Para iniciar la creación de variables podemos hacerlo de tres formas distintas:
- Desde el menú: clic sobre Datos >> Gestionar variables >> Nueva e iniciaríamos el asistente de variables.
- Desde la vista de variables: clic en el botón derecho estando situado el puntero sobre el árbol de variables. Clic en la opción de Añadir variable y selección del tipo de variables a añadir.
- Desde la propia tabla de variables: doble clic sobre cualquiera de las celdas en la ventana que tiene como título tabla de variables. La definición de una variable tiene dos partes fundamentales: definir las propiedades de la variable teniendo en cuenta que vamos a realizar una grabación de datos sobre ella y definir las propiedades que afectarán a la explotación estadística de esa variable. De la misma forma, debemos tener en cuenta que no es lo mismo añadir una variable, que modificar una variable ya existente. Este segundo concepto es mucho más amplio.
El diálogo presenta cinco campos, que consideramos fundamentales al definir una variable:
Nombre
Texto libre con no más de 20 caracteres alfanuméricos que permiten identificar la variable para las futuras operaciones a realizar con ella.
- El nombre de la variable no puede comenzar por blancos ni números y no puede contener signos que no sean alfanuméricos.
- Si se va a trabajar con otros programas, es preferible no utilizar nombres de variables con caracteres extraños (caracteres específicos del castellano o símbolos de puntuación) puesto que la mayoría de programas del mercado no los admiten. Abstenerse de utilizar en los nombres de las variables símbolos como comas, puntos y comas, barras, etc. El único carácter permitido es el _ (subrayado).
- No pueden existir dos variables con el mismo nombre, pero sí se puede hacer, que dos variables aparezcan en tablas con el mismo nombre. El símbolo $ se puede anteponer al nombre de la variable y no será impreso en tablas.
- Siempre que se utilice el nombre de una variable en las condiciones se debe entrecomillar si contiene caracteres de los denominados extraños. De esta forma, el programa reconocerá esos nombres de variable. En condiciones simples no es necesario. Nota: Existen una serie de palabras reservadas que por tener un significado común dentro de la matemática o la estadística no pueden ser utilizadas. Evitar el uso de Nombres de Variable como: SUMA, MEDIA, MAXIMO, MINIMO, DESVIACION, GRUPOS, etc. En la medida de lo posible el sistema reconoce estas palabras y evita su uso.
Tipo
El tipo de variables es el resultado de la traslación de los tipos de preguntasal programa. De esta característica depende el espacio que el programa reservará para los datos y las operaciones que se podrán realizar con esos datos.
- Categoría / nominal; Variable de tipo cualitativo nominal en la cual las categorías —alternativas de respuesta— que la definen vienen codificadas con valores numéricos. Admite sólo una respuesta y un ejemplo de este tipo de variables pueden ser: el sexo de una persona, el color favorito, el nivel socioeconómico, y otras. Es importante distinguirla de las variables numéricas porque con una variable de categoría no podremos realizar operaciones aritméticas de ningún tipo exceptuando que se asignen pesos a cada una de sus categorías. Es por ello que admiten la asignación de peso que las habilita para realizar cálculo aritméticos con las mismas. Si algún código se desea no entre en la asignación de pesos, se dejará en blanco.
- Múltiple; Variable de tipo cualitativo que a diferencia del tipo de variable de categoría, puede recibir más de una respuesta. El delimitador de las distintas contestaciones a esta variable es el separador de listas de Windows. Ejemplos de este tipo de variable puede ser la respuesta a esta pregunta: ¿con qué bancos trabaja usted habitualmente?, ¿cuáles son tus colores favoritos?, equipamiento del hogar, etc.. No puede contener el 0 como código, pues es un valor reservado.
- Numérica métrica; Cualquier variable cuyos valores sean números reales. Para incluir valores negativos se utiliza el – (guión) delante de la primera cifra, y como separador decimal será el indicado en el sistema: punto o coma. La variable numérica siempre implica una medición cardinal, de escala o de intervalo. Si lo que queremos hacer es asignar orden, es preferible utilizar una variable numérica ordinal.
- Numérica ordinal; Variable cuyos datos serán números normalmente enteros y, en algunas ocasiones (rangos medios), con decimales. Esta variable nos permite definir las pruebas estadísticas que se van a poder utilizar con sus datos.
- Número aleatorio; Incluye un número aleatorio entre unos valores que por defecto están establecidos entre 0 y 1.000.000, pero que son modificables desde las propiedades generales.
- Orden de los registros; Numera los registros de 1 a n, siendo 1 el primer registro y n el último. Es automática y por tanto no editable.
- Alfanumérica; Variable en la que se puede grabar un texto alfanumérico de hasta 1024 caracteres. Si se utiliza para posterior uso de codificación manual, es importante saber que el ; será considerado como el separador de ideas o conetnidos para un tratamiento individualizado de las mismas. Por ejemplo, si se nos pregunta marcas de bebidas refrescantes que conocemos y escribimos la respuesta como COCA-COLA;FANTA;SCHWEPPES;TRINA el sistema detectará como literales: COCA-COLA, FANTA, SCHWEPPES, TRINA; la gestión de los mismos será mucho más sencilla a la vez que efectiva respecto a la realidad del contenido.
- Fecha
- Hora
- Fecha de grabación
- Hora de grabación
- Virtual; Variable combinación de categorías de otras variables. Es un tipo de variable que se utiliza para la explotación de datos (generalmente en la tabulación) y nos permite crear nuevas variables con categorías complementarias, suplementarias o que no tengan nada que ver, y sin necesidad de realizar cálculos ni cargar el fichero innecesariamente de bytes. Este tipo de variables se muestra en la ventana de datos con el número de índice de la condición/es que cumple. Si el resultado de la valoración de todas las condiciones es múltiple, se presentará como tal en la ventana de datos. Ver Creando nuevas variables (virtuales, sinónimas, expresiones) para conocer su funcionamiento.
- Sinónimo; Variable que lee la información de otra variable ya existente y la codifica según su propio libro de códigos. Tiene su utilidad en establecer distintas codificaciones para una misma variable, por ejemplo, tramos de edad de 5, 10 o 15 años.
- Expresión aritmética; Tipo de variable cuya formulación es matemática, una fórmula con otras variables y/o funciones del sistema. Ver Creando nuevas variables (virtuales, sinónimas, expresiones) para conocer su funcionamiento.
Texto / Alias
Opcionalmente se puede dar un texto explicativo del nombre de la variable. Normalmente se suele utilizar un texto corto para el nombre de la variable, que no sea complicado de interpretar o que siga una terminología impuesta por el usuario P1, . . . . P123, o V1 o VA1, etc. y para poder explicar esta clave, se utiliza el texto extra.
Este texto extra se puede decidir que aparezca o no en las diferentes tablas de resultados (tabulación) desde las opciones de tabulación, definiéndose por medio de mostrar / eliminar texto extra.
El alias sustituye al nombre de la variable. Tiene dos misiones bien diferenciadas y que no pueden ser utilizadas de forma simultánea. Puede servir para sustituir al nombre de la variable cuando se muestra una tabulación don cálculo de estadísticos sobre la variable que contiene el alias. Por ejemplo, una variable que se llama P5 y tiene como texto extra ¿Cuánta leche consume semanalmente?, le podemos establecer una alias que fuera CONSUMO DE LECHE. En las tablas en lugar de mostrar media de P5, mostraría Media de CONSUMO DE LECHE.
Valores permitidos
Esta propiedad de variable cumple con la función de asignar los valores que vamos a permitir en grabación para cada variable.
Si no se rellena, funciona de la siguiente forma:
- En variables de categoría o múltiples, no permite grabar ningún valor, salvo el & del “No Contesta” o el + del “No sabe”.
Si se rellena con valores o listas de valores, por ejemplo 1_10 o 1_3;99:
- En variables de categoría o múltiples, sólo permitiría grabar esos valores
- En variables de tipo numérico se establecen controles de consistencia (error) a partir de los valores escritos. Si por ejemplo en una numérica establecemos el rango de valores permitidos de 1 a 10, sólo se permitirá grabar estos valores o el no contesta (&) o el no sabe ( + ). En este tipo de variables creará códigos según valores permitidos de forma unitaria hasta 500 códigos.
Códigos
El botón de códigos nos permite acceder a una de las partes más características de Barbwin en su relación con la investigación de mercados, la codificación. Como ya explicamos al principio de esta sección Barbwin permitirá la definición en formato texto de los distintos valores que puede tomar una variable.
image36
Cuando presionamos el botón accedemos a un cuadro de diálogo donde podremos definir en forma de tabla la codificación particular de cada variable. Se distinguen dos partes en la ventana de codificación de la variable, la parte puramente de libro de claves o codificación de la variable y si presionamos el botón clip0089 accedemos a la parte de creación de grupos de códigos donde se podrán crear los “nets”. Existe otra forma de agrupar los códigos mediante la funcionalidad del mismo nombre (mirar agrupar códigos). La codificación es algo tan simple como dar texto a los valores. Iniciamos este apartado definiendo algunos conceptos importantes.
Códigos: cada uno e los valores que puede tomar una variable
Intervalo: conjunto de valores que puede tomar una variable de forma conjunta, estableciendo un máximo y un mínimo valor para formar parte del mismo.
Nombres / Etiqueta de código: cada una de las etiquetas texto con las que podemos nombrar un valor de una variable o intervalo. Por ejemplo, en una variable denominada SEXO decimos que puede tomar valores 1 y 2 (códigos) donde 1 significa ser HOMBRE (nombre del código) y 2 ser MUJER (nombre del código). En otra variable llamada RENTA MENSUAL podemos decir que puede ser contemplado en dos intervalos, de 1 a 600’€ (intervalo) y de 601 a 6.000 €. (intervalo) y además decir que los nombres de código son renta baja y renta alta respectivamente.
En BarbWin los intervalos se separan con el símbolo _ (subrayado) mientras que los códigos se separan con; (puntos y comas), por lo que podemos hacer listas de valores como por ejemplo del 1 al 7 y el 15, su escritura sería 1_7;15, o también del 1 al 23, el 76 y del 534 al 900, sería 1_23;76;534_900. El movimiento dentro de esta tabla es con INTRO y/o flechas. INTRO inicia edición y a partir de ese momento y hasta que se pulse ESC estamos en modo edición. En la parte inferior de la ventana vemos dos series de botones. Nos interesa la segunda por ahora:
clip0345 Un botón representado por una papelera, permite borrar códigos de forma unitaria o si hay varios seleccionados (marcar), todos ellos.
clip0346 clip0347 Los siguientes botones son los de copiar y pegar. Nos permitirán ahorrar mucho trabajo si ya tenemos la tabla escrita en algún otro lugar.
clip0351 Botón que permite el copiado de códigos, con saltos de línea (
)clip0348 Un botón que representa una calculadora, que normalmente estará apagado. Sólo se encenderá y permitirá su utilización en variables de tipo virtual, porque en este tipo de variables como ya comentamos anteriormente en lugar de valores se codifica mediante condiciones sobre terceras variables.
clip0349 Un botón para ordenar los códigos, bien por el texto o bien por el valor.
clip0350 El último botón representado por una hoja de papel con flecha roja, permite copiar la codificación de una variable ya definida a la variable en cuya hoja de codificación nos encontramos.
clip0352 Cambiar a mayúsculas / minúsculas
clip0353 Tratamiento del texto de los códigos
clip0354 Creación de macro de adición de códigos
Códigos especiales
Existen cuatro tipos de valores perdidos o también llamados valores especiales:
Categoría de respuesta denominada No contesta
Categoría de respuesta denominada No sabe
Categoría de respuesta denominada Filtrado
Categoría de respuesta denominada No definida Estos valores que en otros programas suelen no estar identificados o incluso si tienen valor numérico, pueden perturbar el cálculo matemático de medias, desviaciones, etc. Reciben códigos especiales:
No contesta: representado por un &
No sabe: representado por un +
Filtrado: representado por un -
No definida: cualquier valor no incluido entre los códigos definidos para una variable. No tiene representación alguna, puede ser un blanco, puede ser nada (NULL) puede ser un 100, etc. En este documento nos referiremos a estos valores como valores especiales y concretamente en las condiciones y en el texto de los ejemplos nos referiremos a ellos por sus valores. Se aconseja la utilización de esta simbología y no la utilización de valores métricos, ya que en ocasiones ante un despiste en el cálculo o un intercambio de datos, un valor 99 contemplado como un “no contesta” en una aplicación puede ser interpretado como valor válido en otra.
Códigos visibles
Acceso al gestor de códigos que se mostrarán en las tablas de frecuencias. En muchas ocasiones se utilizan en combinación con las operaciones de códigos, haciendo que éstos queden ocultos y se muestren sólo estas últimas.
Pueden ser hechos invisibles todos o algunos de los códigos. El hecho de no estar visible el código no implica modificación en los cálculos. No se muestran pero siguen formando parat de la base de cálculo.
clip0430
Gestor de códigos visibles
El gestor es muy sencillo, posibilitando elegir cuáles son los hechos invisibles eligiendo sobre la lista Windows, siendo por tanto posible utilizar May + Clic o Ctrl + Clic.
clip0431
Gestor con códigos invisibles
Grupos de códigos
Si dentro de la gestión de códigos presionamos el botón image40 accedemos a la parte de creación de grupos de códigos donde se podrán crear los “nets”. Existe otra forma de agrupar los códigos mediante la funcionalidad del mismo nombre (mirar agrupar códigos -nets-).
image37
Gestor de grupos de códigos
Los grupos de códigos responden a la necesidad de los técnicos de poder en tablas (filas y columnas) representar información agregada, por ejemplo motivaciones generales. Su importancia aumenta cuando debemos ordenar las alternativas de respuesta por frecuencia, ya que se respeta el orden en los grupos.
Para crear nuevos grupos de códigos, disponemos de un botón en la parte inferior derecha, nos solicita nombre y para incluir códigos individuales en el grupo, tan solo tenemos que arrastrar y soltar. Es muy importante saber que crear un grupo de códigos, no implica que se obtendrá información agregada del mismo. El grupo es sólo texto. Si necesitamos tener información agregada, debemos crear un código individual nuevo que sea la agrupación de otros.
Al presionar image41nos permite crear un grupo nuevo, en nuestro caso por ejemplo podría ser fin de semana.
image38
Este grupo se da de alta en la parte derecha y arrstramos y soltamos los códigos que deben formar parte de él.
image39
Si tabulamos esta variable, obtenemos el resultado:
image45
Podemos observar como los grupos de códigos se organizan al final de la variable quedando los códigos no agrupados en el inicio de la variable. Para que el otros pueda estar al final deberá formar parte de un grupo. Además podemos observar que no se suman los códigos dentro del grupo, para ello hay que forzar la creación de un subtotal.
image42
Tras haber añadido un nuevo grupo y dado de alta una nueva categoría de códigos que es la agregación del resto, el resultado que obtenemos es el siguiente:
image43
Desde la versión 7.5.1442, se añade una nueva funcionalidad. Si se añade una etiqueta de código que se inicia con la @ y es una agrupación de códigos, en la tabla saldrá reflejado como subtotal. Aquí exponemos un ejemplo de codificación y su salida en marginales.
clip0002
Y la salida al tabular:
clip0003
Podemos observar como el grupo tiene un subtotal que se corresponde como código NET. Siempre se ubica al principio. En este ejemplo cada grupo tiene una excepción (3, 9 y 6; salen al final de su grupo) y hay unos códigos no agrupados que tienen también una excepción (101, sale al final de los no agrupados). cada grupo se separa por su nombre y los elementos de cada grupo se les antepone un > para identificarlos más facilamente.
Creación de códigos en virtuales
Específicamente en las variables virtuales, con el objeto de agilizar la creación de códigos, se proporciona ahora un diálogo desde el que se pueden crear rápidamente conjuntos de códigos de variables.
Este diálogo presenta la mecánica habitual de trabajo:
- Selección de variables.
- Seleccionar tipo de combinación entre las variable, tipo O ó tipo Y, por ejemplo hombre y rubio o hombre o rubio.
- Si se elige combinada, tipo de relación: unitaria no hay combinación, código a código (típica para espontáneo + sugerido), todos por todos, hace todos los cruces posibles entre las categorías de las variables.
- Por último, se puede mostrar el nombre de todas las variable o no hacerlo y también si la combinación es código a código, dejar sólo los códigos de la primera variable, evitando así la repetición del mismo texto varias veces en el nombre del código.
Cambio mayúsculas / minúsculas
Transforma la lista de códigos a mayúsculas o minúsculas.
Propiedades generales
image31
- Códigos especiales, en todos los programas relacionados con la investigación de mercados, hay unos valores que se utilizan de forma predeterminada para aquellos valores que puede recibir una variable de forma especial y que tienen que ver con la ausencia de respuesta. Nos estamos refiriendo a:
- No sabe ( + )
- No contesta (&)
- Filtrado o no procede ( – )
- No definido (es un valor no definido aquel valor que no entra en los intervalos definidos en codificación, por ejemplo una variable con escala de 1 a 10, si tiene una valor 16 —por error— es un no definido.
- La opción Agrupar especiales, permite que los valores especiales que entran en la base de cálculo, puedan agruparse en un sólo grupo que serían los famosos “missing values”.
Las primeras propiedades tiene que ver con esto. Entre paréntesis hemos establecido el código que por defecto utiliza el programa. Sin embargo, el usuario puede escribir nuevos valores en propiedades e incluso, sobreescribir los textos que aparecen, por ejemplo que el 99 sea el No Contesta y utilicemos el inglés DA (“don’t answer”) y para el no sabe el 98 y fuera el texto el DK (“don’t know”).
- Longitud parte entera, Número de caracteres enteros en una variable numérica, contabilizando el signo y el punto o coma decimal.
- Rango de valores, Sólo visible para variables de número aleatorio, establece el mínimo y el máximo valor que tomará la variable.
- Decimales, Número de decimales que permitimos a la variable en: porcentajes, estadísticos y en el caso de variables numéricas métricas, en datos.
- Dígitos no contemplados en menciones (sólo múltiples), En ocasiones en las variables de tipo múltiple encontramos que existen determinados códigos que no queremos contabilizar en el cálculo de menciones, por ejemplo las etiquetas TODOS, NINGUNO, etc. En estos casos, estos códigos no computan para la formación de la media de menciones.
- Rango de valores (sólo en variables de tipo orden de registros), Establece el valor desde el que comenzará a rellenarse la variable de tipo orden. Si ya tiene valor, éste será el máximo valor alcanzado en la variable. Derivado de esto, siq queremos reiniciar la numeración bastará con poner como rango de valores = 0 y Aceptar.
- Rango de valores (mínimo y máximo, sólo en variables de tipo número aleatorio), Establece los valores de referencia entre los que se calculará el valor del dato en una variable de este tipo.
Propiedades de tabulación
clip0550
El diálogo de propiedades presenta una serie de paneles no ordenados (su orden responde a un diseño homogéneo para la optimización del espacio). Podemos distinguir diferentes agrupaciones.
Eliminar y mostrar Los paneles de mostrar y eliminar, permiten establecer que filas o columnas de las consideradas especiales se muestran o no en las tablas.
- Por porcentajes, elimina las filas (especiales o códigos) que tengan un porcentaje inferior al establecido. Si se combina con invertir, elimina todas las filas con un porcentaje mayor al indicado.
- Eliminar columnas sin información, no muestra el elemento reseñado por debajo del n de frecuencia que se establezca.
- Eliminar filas sin información, no muestra el elemento reseñado por debajo del n de frecuencia que se establezca.
- Eliminar bases sin información, no muestra el elemento reseñado por debajo del n de frecuencia que se establezca.
- Eliminar columnas de valores especiales sin información, no muestra el elemento reseñado por debajo del n de frecuencia que se establezca.
- Eliminar filas de valores especiales sin información, no muestra el elemento reseñado por debajo del n de frecuencia que se establezca.
- Eliminar el nombre de la variable, no muestra el elemento reseñado si está activada la opción.
- Eliminar el texto extra de la variable, no muestra el elemento reseñado si está activada la opción.
- Eliminar la información de bases especiales, elimina los datos a la derecha del nombre de la variable (en la fila del nombre de la variable) no tiene efecto si esta fila no está activa.
- Mostrar No sabe en filas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar No sabe en columnas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar No contesta en filas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar No contesta en columnas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar No definidos en filas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar No definidos en columnas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar Filtrados en filas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Mostrar Filtrados en columnas, muestra el texto del elemento reseñado aunque esté vacío. Para eliminar si está vacío, utilizar la opción correspondiente del panel eliminar.
- Agrupar valores especiales, permite unir en una sola fila / columna de tabla las categorías especiales de no sabe, no contesta, no procede (filtrado) y no definido, siempre y cuando éstas no hayan sido eliminadas de la base de cálculo.
- Utilizar grupos de códigos, habilita la propiedad de tener en cuenta la existencia de grupos en las codificaciones, mostrando subtítulos en las filas o columnas de la tabla. Panel de estadísticos básicos (sólo categoría y numérica métrica)
- El panel de estadísticos básicos habilita al usuario para que decida si las variables de tipo numérico métrico y las variables de categoría / nominales con peso se les debe calcular la media aritmética y la desviación típica o también mostrar una línea de tabla con el número de registros que forman el N o base del cálculo estadístico para esa variable.
- Panel de variables múltiples. El panel de variables múltiples habilita al usuario para establecer el cálculo de la media de menciones (media aritmética del número de respuestas que da un entrevistado), el número de registros que mencionan algo en una variable múltiple. Por otro lado permite que el cálculo de las frecuencias en las múltiples (porcentajes) se haga sobre la base del número de respuestas y no al número de casos como sería lo normal.
- Panel de no codificadas. El panel de variables no codificadas, habilita al usuario para poder tabular variables a las que no se les ha establecido codificación alguna, alfanuméricas, numéricas sin intervalos, etc. Se pueden calcular frecuencias unitarias, estadísticos o no permitir su tabulación.
- Panel de sacar de la base. El panel base de cálculo habilita al programa para que de forma automática elimine de la base de casos válidos los registros que en una determinada variable tengan como respuesta: no sabe ( + ), no contesta (&), no procede (filtrado, – ), o cualquier valor que no entre en la lista de códigos establecida para esa variable (valores perdidos, no definido). Cuando están activas estas opciones, junto al nombre de la variable en tablas aparece el número de casos que está conformando la base de cálculo.
- Poneración particular de la variable. Si una variable de forma particular estuviera ponderada por otra variable, cuando esa variable particular fuera tabulada, su ponderación sería la propia y no la del resto. Otras opciones
- Códigos visibles e invisibles, nos da la opción de poder seleccionar qué códigos son visibles o invisibles en la impresión de una tabla. Los cálculos se realizan pero no se muestran. Atención, porque es una opción sensible a la modificación de los códigos si ésta consiste en la creación o borrado de nuevos códigos.
- Calcular códigos con bases, nos da la opción de poder establecer bases de cálculo especiales los diferentes códigos de una variable. Las bases son especiales, pues no son las mismas del estudio. Tienen función y gestión propia independiente de las bases del estudio.
- Mostrar los nombres de las bases en los códigos
- Relacionado con la anterior opción, muestra los nombres de las bases en los códigos a los que se aplican, o directamente obtiene los resultados.
- Porcentajes sobre bases no ponderadas, cálculo de porcentajes sobre la base real y no sobre la base ponderada.
- Utilizar como base de cálculo el primer código, influir en que el cálculo de porcentajes de una tabla de frecuencias se realice siempre con la base obtenida en el recuento de frecuencias del primer código en la variable.
- Mostrar nombre de estadísticos, sólo en variables numéricas métricas o en variables de categoría con marca de clase (peso), cuando se hace una tabla de estadísticos que no se imprima el texto del mismo. Panel de bases
- Bases de variable. Mediante este botón accedemos a un gestor individual de las bases de cada variable. En este gestor asociamos qué bases son las asignadas a la variable. Si queremos asociar varias bases a varias variables, lo podemos hacer con el asociar bases.
- Bases de código.
- Rangos de estadísticos
- Operaciones con códigos
Grupos de variables
En ocasiones por motivos de organización es necesario disponer las variables en grupos. Esto permitirá a los usuarios del programa, mantener organizadas sus variables en grupos de mayor nivel.
Las diferentes acciones relacionadas con la gestión de los grupos de variable son:
- Añadir / editar / eliminar grupo
- Asociar / desasociar grupo Además de la organización, la utilización de grupos permite que en determinados diálogos, la lista de variables disponibles para trabajar se pueda presentar organizada en función de los grupos.
Para añadir un grupo de variables tenemos dos caminos diferentes:
- Clic en el menú contextual estando situado en el panel de vistas titulado grupos; en este caso, nos solicita el nombre del grupo y lo añade a la vista en forma de árbol
- Clic en el menú contextual de variables en la entrada gestión de grupos; en este caso no muestra un gestor de grupos donde se puede escribir el nombre del grupo y su texto extra (aclaratorio y sin ninguna función auxiliar) clip0355
La funcionalidad del gestor es la típica:
- clip0356 Eliminar un grupo
- clip0357 Copiar lista del portapapeles
- clip0358 Pegar lista al portapapeles
- clip0359 Ver variables asociadas al grupo seleccionado
Cuando una variable se encuentra asociada a un grupo, es permitido el poder en los cuadros de tabulación trabajar bien con los grupos o bien con las variables de forma individual.
clip0360 Diálogo de asociación de grupos
Estando seleccionadas una o varias variables se pueden asociar éstas a grupos de variable. Si los grupos de todas las variables no son iguales, se solicita confirmación para sustituir.