Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

Análisis de la Autenticidad de Firmas Digitales: Un Estudio de Caso, Summaries of Criminology

Un estudio de caso sobre la autenticación de firmas digitales, utilizando un enfoque basado en la extracción de características y el análisis de vectores de características. Se describe el proceso de recolección de firmas, la extracción de características, el entrenamiento de un modelo de red neuronal y la evaluación del sistema de autenticación. El documento proporciona información valiosa sobre las técnicas de análisis de firmas digitales y su aplicación en la seguridad informática.

Typology: Summaries

2022/2023

Uploaded on 09/21/2024

eduardo-acevedo-11
eduardo-acevedo-11 🇺🇸

1 document

1 / 15

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
61
C A P I T U L O 4
D I S E Ñ O D E L S I S T E M A P A R A L A V E R I F I C A C I Ó N D E L A
A U T E N T I C I D A D D E U N A F I R M A A U T Ó G R A F A O F F - L I N E
P R O P U E S T O
Para la elaboración de los módulos que conforman el sistema de verificación automática off-line fue
necesario realizar la siguiente serie de consideraciones, mismas que obedecen al diagrama propuesto
por Wayman [1], al cual se le aplicaron las siguientes modificaciones, para su adecuación al caso de
estudio.
Figura 4.1. Diagrama tipo Wayman Modificado para su adecuación a las necesidades derivadas de las
características propias del análisis off-line de una firma autógrafa.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Partial preview of the text

Download Análisis de la Autenticidad de Firmas Digitales: Un Estudio de Caso and more Summaries Criminology in PDF only on Docsity!

C A P I T U L O 4

D I S E Ñ O D E L S I S T E M A P A R A L A V E R I F I C A C I Ó N D E L A

A U T E N T I C I D A D D E U N A F I R M A A U T Ó G R A F A O F F - L I N E

P R O P U E S T O

Para la elaboración de los módulos que conforman el sistema de verificación automática off-line fue necesario realizar la siguiente serie de consideraciones, mismas que obedecen al diagrama propuesto por Wayman [1], al cual se le aplicaron las siguientes modificaciones, para su adecuación al caso de estudio.

Figura 4.1. Diagrama tipo Wayman Modificado para su adecuación a las necesidades derivadas de las características propias del análisis off-line de una firma autógrafa.

4.1. Recopilación de Datos.

La adquisición de los datos se realizó por medio de hojas de papel bond blanco tamaño carta. Con 14 divisiones, ordenadas en 2 columnas y 7 renglones. Cada división fue de 9 cm de largo por 3.1 cm de ancho. Como la que se muestra en la Figura 4.2.

Figura 4.2. Ejemplo del formato de recolección de firmas utilizado que contiene un conjunto de firmas válidas para su utilización en el proyecto

Se enrolaron 42 personas que estamparon su firma 7 veces y que imitaron la firma de alguien más en igual número de ocasiones. La información recabada entonces constó de 588 grafos: 294 firmas originales y 294 falsificaciones.

Para esto se solicitó a los participantes que firmaran con bolígrafo negro de punto mediano y que realizaran la firma dentro de los límites de cada rectángulo.

Posteriormente todos los formatos tamaño carta fueron escaneados mediante el scanner delEquipo

Multifunción HP PSC 1315.

tamaño de la señal (numero de renglones) de cada firma a extraer. A continuación se encontraron los índices que exceden el umbral de activación sobre la derivada, se definieron los cortes respecto a la señal de índices original.

Aislamos la señal de la firma dejando cierta holgura para evitar que se incluyeran los bordes de los marcos, recurrimos a las diferencias nuevamente para determinar el tamaño de cada segmento, dividimos entre 2 para determinar un desplazamiento o padding de corte, incluimos un cero al final para que fuera posible conformar las operaciones matriciales. Los cortes definitivos resultan de las anteriores más el padding, al transponerlo y redefinir los cortes como parejas renglón inicial y renglón final sólo tomamos los 7 primeros que corresponden con las firmas. Lo que da como resultado firmas individuales tal como se muestra en la figura 4.3.

Figura 4.3. Firma recortada obtenida a partir de la plantilla utilizando Gradiente de Sobel para destacar los bordes y encontrar los puntos de corte.

Extracción del vector de características.

La extracción del vector de características se realizó a través de Función de Densidad de Probabilidad para cada una de las 560 firmas. Este proceso se describe en forma general en el capítulo 2, por lo que en este apartado sólo se hará mención de los cambios que fueron necesarios para el caso que nos ocupa. Mostrándose también algunos ejemplos de los histogramas resultantes.

Los cambios sobre la idea original [8] se realizaron al obtener los valores de la dirección del gradiente, en vez de adicionar /2 se sumaron 2. Esto se debió a que se utilizó la función atan2 de Matlab, que preserva el valor de las ordenadas, tanto para valores positivos como para negativos. Al agregar el valor de 2 se logró utilizar el rango completo de ángulos proporcionados por la función atan2.

Por esto la fórmula en cuestión se modificó, quedando de la siguiente manera:

( , ) tan 2 2

x

y

G

mn a G^ …^ (1)

La información de la dirección (m,n) ha sido limitada por el rango 0≤ (m,n)<2 , por lo tanto Hw( (^) i) es valuada para el rango de (^) i con un incremento de grado y está definida por:

Donde Si

Y ( m,n) es localizada en la línea de la firma

Si no

Con

Por efecto de las ecuaciones (3) y (4) anteriores, que entregan más peso a la localización de pixeles en los pasos de los niveles de grises siguiendo la línea de la firma, es posible disminuir gradualmente la influencia del ruido residual localizado en el área del fondo.

La dirección total de la Función de Densidad de Probabilidad (PDF) Fw( (^) i) puede ser definida como los valores de densidad:

, para todo i

Donde el valor discreto de la direccionalidad (^) i, está definido en el rango de 0≤ (^) i<N con N =360. Entendiéndose Md como la media y Ds como la desviación estándar. Esta normalización es una contribución original de este trabajo y se incluye para disminuir la influencia de componentes dominantes de los vectores PDF.

Post-Procesamiento.

Para mayor claridad, el post-procesamiento se expone en dos partes:

  1. Filtro. Se uso un filtro direccional FW’( ) definido para suavizar FW( ) con una distribución binomial [8] en el lapso de siete canales teniendo:

Figuras 4.5. Vectores de una firma auténtica y una falsificación de una de las personas enroladas y sus correspondientes grafos. A. En este gráfico se muestran dos vectores característicos que pertenecen a una falsificación y una firma original del enrolado 35; observamos que la grafica de falsificación no presenta coincidencias para la mayoría de los puntos y que las distancias entre las no coincidencias son amplias. Aunque, existen rangos donde los puntos o el comportamiento de las graficas son similares. B. Primer firma original plasmada por el enrolado 35 representada en la figura A por el histograma cuyos puntos están marcados con “x” C. Falsificación del tipo skill forgery obtenida tomando como base la rúbrica presentada en la figura B y cuyo histograma está marcado en la figura A con “o”

  1. Submuestreo. Este proceso se realizó con la finalidad de obtener regiones representativas de cada una de las firmas, pues al observar las representaciones que ejemplifica la figura 4.5, se notó la existencia de áreas de coincidencias o de comportamientos similares entre las firmas.

Para poder llevar a cabo esta labor se utilizaron algoritmos genéticos multiobjetivo; ya que estos nos proporcionan la ventaja de optimizar más de un objetivo a la vez, esta es la razón de que se utilizara NSGA-II [42] descrito en el Capítulo 3. En la Figura 4.6 se muestran las gráficas de soluciones obtenidas para la firma de los enrolados 1 y 35.

-0.4 0 50 100 150 200 250 300 350 400

-0.

0

1

Ángulo

Densidad

Representación en frecuencia después de filtro binomial: firma original vs. falsificación (Enrolado 35)

falsificación

original

A

B

C

Figuras 4.6 A y B Comportamientos del Pareto NSGAII sobre los vectores característicos respectivos

-2718.5 19 19.5 20 20.5 21 21.5 22 22.5 23

f1 - Minimización de la distancia intra-clase

f2 - Maximización de la distancia inter-clase

Algoritmo Genético Multiobjetivo tipo Pareto NSGAII - Enrolado 1

Primera generación Generación final

-2210.5 11 11.5 12 12.5 13

f1 - Maximización de la distancia intra-clase

f2 - Maximización de la distancia inter-clase

Algoritmo Genético Multiobjetivo tipo Pareto NSGAII - Enrolado 35

Primera generación Generación final

A

B

Figura 4.7. En esta figura se ilustra la ubicación del medoide que fue tomado como máscara.

Figura 4.8. Como se ilustra en la gráfica, la máscara nos proporcionó las áreas representativas de cada uno de los vectores de las firmas de cada enrolado, pues recordando que en sus curvas en frecuencia se observan los comportamientos que pueden considerarse como los más complicados debido a los cruces y las superposiciones entre las curvas originales y sus falsificaciones.

-2210.5 11 11.5 12 12.5 13

X: 10.75Y: -20.

f1 - Maximización de la distancia intra-clase

f2 - Maximización de la distancia inter-clase

Algoritmo Genético Multiobjetivo tipo Pareto NSGAII - Enrolado 35

Primera generación Generación final

M edoide

0 50 100 150 200 250 300 350 400

-0.

0

1

Ángulo

Aplicación de la máscara al v ector de características

    1. 4 (^00 2 4 6 8 10 12) x 10 (^144)
    1. 8^1

vector característico

La Figura 4.8 muestra el comportamiento del enrolado 35. Que se utilizará en el nodo de entrada de la red neuronal individual tipo Radial Basis que finalmente tomará una decisión respecto a la autenticidad del grafo a prueba.

4.3.3 Almacenamiento de Datos

Para este proyecto decidimos conservar todos los datos obtenidos desde la adquisición, por lo que

contamos tanto con las hojas de formato llenas como con lo que propiamente conforma unAlmacén

de datos biométricos, es decir las firmas escaneadas y recortadas y los vectores de características

asociados a éstas.

Las firmas digitales se encuentran en un sistema ficheros de formato JPG ordenados de acuerdo al número asignado al enrolado y al número de rubrica de que se trate de 1 a 7 en orden ascendente con los prefijos “o” y “f” de acuerdo al tipo de firma del que se tratara original o falsificación.

Los vectores de características también se encuentran ordenados en forma similar.

Tenemos dos conjuntos de estos vectores: Uno que contiene toda la información en frecuencia correspondiente al grafo en cuestión. El otro que conserva solamente la información que de acuerdo al algoritmo genético aplicado se consideró como relevante para el análisis de las firmas.

Todos los archivos se encuentran en el árbol de carpetas que se describe a continuación

bd firmas Escaneadas Almacén de hojas de formato escaneadas Firmas ES Contiene firmas JPG recortadas M Máscaras de submuestreo RB Contiene centroides, matrices de pesos (W), ( ) y desviaciones estándar (ds) VC Vectores de características

  1. Centroides.
  2. Función de base radial
  3. Función de activación (ds)
  4. Matriz de Pesos (W)

Al realizar la fase de verificación en la red neuronal para cada firma se obtuvo un único valor resultante. Este valor se comparó con el umbral. Cuando el resultado fue mayor, entonces se corroboró que la firma era original, cuando fue menor se consideró como una falsificación.

4.5. Evaluación.

Para el análisis de resultados se propuso, probar el sistema con varios umbrales. Para obtener dichos valores de umbral se realizaron tanto incrementos como decrementos en porcentaje del valor máximo obtenido al probar en la red neuronal 4 Firmas Falsificadas Entrenadas.

Los resultados obtenidos se muestran en la tabla siguiente:

umbral FR FA skill FA random

  • 96.50% 8.13% 26.83% 8.17%
  • 96.30% 8.13% 26.83% 8.15%
  • 96.25% 8.13% 26.86% 8.11%
  • 96.20% 8.13% 26.83% 8.09%
  • 96.00% 8.13% 26.83% 8.03%
  • 95.00% 8.13% 26.02% 7.80%
  • 80.00% 10.57% 23.58% 5.75%
  • 60.00% 10.57% 21.14% 4.90%
  • 40.00% 12.20% 18.70% 4.39%
  • 20.00% 12.20% 15.45% 4.07%
  • 15.00% 12.20% 14.63% 3.96%
  • 10.00% 13.01% 13.01% 3.84%
    • 5.00% 13.82% 12.20% 3.82%
    • 1.00% 15.45% 12.20% 3.80% 1.00% 15.45% 12.20% 3.76% 2.00% 16.26% 12.20% 3.76% 5.00% 17.20% 12.20% 3.64% 15.00% 22.76% 12.20% 3.64% Tabla de Resultados: Porcentajes de Error de: Falso Rechazo de una firma original ( FR ), Falsa Aceptación de una falsificación entrenada ( FA skill ) y Falsa Aceptación de una falsificación aleatoria ( FA random ).

Como se muestra en la Tabla de Resultados , el porcentaje de Falsa Aceptación obtenido para las

firmas aleatorias (Random Forgeries) es bajo. Esto muestra que la distribución de distancia inter

plantilla se traslapa con la distribución de la plantilla genuina en muy poca área. Este resultado se logró gracias a que para el cálculo del umbral incluimos 4 firmas aleatorias, que afectaron el valor del umbral de tal forma que la mayoría de las firmas aleatorias fuera rechazada.

De la misma manera se observa que mientras menor sea el porcentaje en que se afecta al umbral, la tasa de falso rechazo ( FR ) disminuye sin embargo ésta no disminuye en forma lineal, como se observa en la gráfica Figura 4.10. La gráfica muestra la relación inversa entre la tasa de falso rechazo y las falsas aceptaciones tanto para falsificaciones entrenadas como para falsificaciones aleatorias. La gráfica ilustra que la caída en la tasa de falsa aceptación para falsificaciones aleatorias cae de manera prácticamente lineal con una pendiente moderada. El caso de la tasa de falsas aceptaciones para falsificaciones entrenadas cae rápidamente para estabilizarse pasando el punto de cruce (Equal Error Rate) con la gráfica de tasa de falsos rechazos.

Con respecto a “ FA sikill ” tasa de Falsa Aceptación para las Firmas Falsificadas (Skill Forgeries), ésta

es como se suponía inversa a FR ya que su comportamiento muestra que entre más bajo es el umbral es más alto este índice. Llegando a un total de 26.83%; también ilustrado en la Figura 4.10.

Figura 4.10. Representación gráfica del comportamiento de sistema con respecto a incremento del valor máximo obtenido ( umbral) al probar el sistema con 8 firmas autógrafas; compuesta con 4 firmas aleatorias y 4 firmas falsificadas.

0.00%

5.00%

10.00%

15.00%

20.00%

25.00%

30.00%

  • 100.00% - 80.00% - 60.00% - 40.00% - 20.00% 0.00% 20.00%

% d e e r r o r

umbral

FR FA skill FA random