Note |
---|
ATENCIÓN, ESTA PÁGINA ES PARTE DE UN TRABAJO EN CURSO, Y POR TANTO SUS CONTENIDOS SE ENCUENTRAN SUJETOS A REVISIONES Y CAMBIOS SIN PREVIO AVISO. |
...
PÉRDIDA DE INFORMACIÓN | VARIABLES PIVOTE | BLOQUE 1 | BLOQUE 2 | BLOQUE 3 | |||||
---|---|---|---|---|---|---|---|---|---|
TITULACIÓN | CENTRO | AÑO NACIMIENTO | GÉNERO | CRÉDITOS MATRICULADOS | CRÉDITOS PRESENTADOS | CRÉDITOS SUPERADOS | |||
VARIABLES PIVOTE | TITULACIÓN | 37,5% |
|
|
|
|
|
|
|
CENTRO | 37,5% |
|
|
|
|
|
|
| |
BLOQUE 1 | AÑO NACIMIENTO | 0% |
|
|
|
|
|
|
|
BLOQUE 2 | GÉNERO | 0% |
|
|
|
|
|
|
|
BLOQUE 3 | CRÉDITOS MATRICULADOS | 0% |
|
|
|
|
|
|
|
CRÉDITOS PRESENTADOS | 0% |
|
|
|
|
|
|
| |
CRÉDITOS SUPERADOS | 0% |
|
|
|
|
|
|
|
La tabla de diferencial de privacidad nos indica, por ejemplo, las siguientes cosas:
El dataset anonimizado final nos permitirá realizar cualquier cálculo (recuentos, medias, máximos, mínimos, etc.) sobre cualquier variable usando como criterio de agrupación la Titulación, el Centro, o ambos.
El dataset anonimizado nos permitirá calcular, por ejemplo, la tasa de éxito (créditos superados respecto a créditos matriculados), al haberse conservado la relación entre ambas variables (puesto que ambas pertenecen al mismo bloque de coherencia, lo que se denota con un en la tabla)
El dataset anonimizado NO nos permitirá calcular, por ejemplo, la media de créditos matriculados por Género, al NO haberse conservado la relación entre las variables implicadas (“género” y “créditos matriculados” pertenecen a distintos bloques de coherencia, lo que se denota con un en la tabla)
Las variables pivote (“Titulación” y “Campo” “Centro”) han perdido el 37,5% de sus valores (NOTA: en los datasets reales esta pérdida suele ser marginal)
Note |
---|
En resumen: los dos datos fundamentales que el reutilizador debe conocer para interpretar correctamente un dataset anonimizado son:
Estos dos datos se especifican en el apartado 4 (Anonimización) en la definición de cada dataset. Es esencial que el reutilizador conozca y entienda el diferencial de privacidad de las implicaciones de la anonimización en cada dataset anonimizado, pues será es determinante para establecer la viabilidad y pertinencia corrección del uso que quiera darle al datasetmismo. |