









Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Community
Ask the community for help and clear up your study doubts
Discover the best universities in your country according to Docsity users
Free resources
Download our free guides on studying techniques, anxiety management strategies, and thesis advice from Docsity tutors
Un estudio de caso sobre la autenticación de firmas digitales, utilizando un enfoque basado en la extracción de características y el análisis de vectores de características. Se describe el proceso de recolección de firmas, la extracción de características, el entrenamiento de un modelo de red neuronal y la evaluación del sistema de autenticación. El documento proporciona información valiosa sobre las técnicas de análisis de firmas digitales y su aplicación en la seguridad informática.
Typology: Summaries
1 / 15
This page cannot be seen from the preview
Don't miss anything!
Para la elaboración de los módulos que conforman el sistema de verificación automática off-line fue necesario realizar la siguiente serie de consideraciones, mismas que obedecen al diagrama propuesto por Wayman [1], al cual se le aplicaron las siguientes modificaciones, para su adecuación al caso de estudio.
Figura 4.1. Diagrama tipo Wayman Modificado para su adecuación a las necesidades derivadas de las características propias del análisis off-line de una firma autógrafa.
La adquisición de los datos se realizó por medio de hojas de papel bond blanco tamaño carta. Con 14 divisiones, ordenadas en 2 columnas y 7 renglones. Cada división fue de 9 cm de largo por 3.1 cm de ancho. Como la que se muestra en la Figura 4.2.
Figura 4.2. Ejemplo del formato de recolección de firmas utilizado que contiene un conjunto de firmas válidas para su utilización en el proyecto
Se enrolaron 42 personas que estamparon su firma 7 veces y que imitaron la firma de alguien más en igual número de ocasiones. La información recabada entonces constó de 588 grafos: 294 firmas originales y 294 falsificaciones.
Para esto se solicitó a los participantes que firmaran con bolígrafo negro de punto mediano y que realizaran la firma dentro de los límites de cada rectángulo.
tamaño de la señal (numero de renglones) de cada firma a extraer. A continuación se encontraron los índices que exceden el umbral de activación sobre la derivada, se definieron los cortes respecto a la señal de índices original.
Aislamos la señal de la firma dejando cierta holgura para evitar que se incluyeran los bordes de los marcos, recurrimos a las diferencias nuevamente para determinar el tamaño de cada segmento, dividimos entre 2 para determinar un desplazamiento o padding de corte, incluimos un cero al final para que fuera posible conformar las operaciones matriciales. Los cortes definitivos resultan de las anteriores más el padding, al transponerlo y redefinir los cortes como parejas renglón inicial y renglón final sólo tomamos los 7 primeros que corresponden con las firmas. Lo que da como resultado firmas individuales tal como se muestra en la figura 4.3.
Figura 4.3. Firma recortada obtenida a partir de la plantilla utilizando Gradiente de Sobel para destacar los bordes y encontrar los puntos de corte.
Extracción del vector de características.
La extracción del vector de características se realizó a través de Función de Densidad de Probabilidad para cada una de las 560 firmas. Este proceso se describe en forma general en el capítulo 2, por lo que en este apartado sólo se hará mención de los cambios que fueron necesarios para el caso que nos ocupa. Mostrándose también algunos ejemplos de los histogramas resultantes.
Los cambios sobre la idea original [8] se realizaron al obtener los valores de la dirección del gradiente, en vez de adicionar /2 se sumaron 2. Esto se debió a que se utilizó la función atan2 de Matlab, que preserva el valor de las ordenadas, tanto para valores positivos como para negativos. Al agregar el valor de 2 se logró utilizar el rango completo de ángulos proporcionados por la función atan2.
Por esto la fórmula en cuestión se modificó, quedando de la siguiente manera:
x
y
La información de la dirección (m,n) ha sido limitada por el rango 0≤ (m,n)<2 , por lo tanto Hw( (^) i) es valuada para el rango de (^) i con un incremento de grado y está definida por:
Donde Si
Si no
Con
Por efecto de las ecuaciones (3) y (4) anteriores, que entregan más peso a la localización de pixeles en los pasos de los niveles de grises siguiendo la línea de la firma, es posible disminuir gradualmente la influencia del ruido residual localizado en el área del fondo.
La dirección total de la Función de Densidad de Probabilidad (PDF) Fw( (^) i) puede ser definida como los valores de densidad:
, para todo i
Donde el valor discreto de la direccionalidad (^) i, está definido en el rango de 0≤ (^) i<N con N =360. Entendiéndose Md como la media y Ds como la desviación estándar. Esta normalización es una contribución original de este trabajo y se incluye para disminuir la influencia de componentes dominantes de los vectores PDF.
Post-Procesamiento.
Para mayor claridad, el post-procesamiento se expone en dos partes:
Figuras 4.5. Vectores de una firma auténtica y una falsificación de una de las personas enroladas y sus correspondientes grafos. A. En este gráfico se muestran dos vectores característicos que pertenecen a una falsificación y una firma original del enrolado 35; observamos que la grafica de falsificación no presenta coincidencias para la mayoría de los puntos y que las distancias entre las no coincidencias son amplias. Aunque, existen rangos donde los puntos o el comportamiento de las graficas son similares. B. Primer firma original plasmada por el enrolado 35 representada en la figura A por el histograma cuyos puntos están marcados con “x” C. Falsificación del tipo skill forgery obtenida tomando como base la rúbrica presentada en la figura B y cuyo histograma está marcado en la figura A con “o”
Para poder llevar a cabo esta labor se utilizaron algoritmos genéticos multiobjetivo; ya que estos nos proporcionan la ventaja de optimizar más de un objetivo a la vez, esta es la razón de que se utilizara NSGA-II [42] descrito en el Capítulo 3. En la Figura 4.6 se muestran las gráficas de soluciones obtenidas para la firma de los enrolados 1 y 35.
-0.4 0 50 100 150 200 250 300 350 400
-0.
0
1
Representación en frecuencia después de filtro binomial: firma original vs. falsificación (Enrolado 35)
Figuras 4.6 A y B Comportamientos del Pareto NSGAII sobre los vectores característicos respectivos
-2718.5 19 19.5 20 20.5 21 21.5 22 22.5 23
Primera generación Generación final
-2210.5 11 11.5 12 12.5 13
Primera generación Generación final
Figura 4.7. En esta figura se ilustra la ubicación del medoide que fue tomado como máscara.
Figura 4.8. Como se ilustra en la gráfica, la máscara nos proporcionó las áreas representativas de cada uno de los vectores de las firmas de cada enrolado, pues recordando que en sus curvas en frecuencia se observan los comportamientos que pueden considerarse como los más complicados debido a los cruces y las superposiciones entre las curvas originales y sus falsificaciones.
-2210.5 11 11.5 12 12.5 13
X: 10.75Y: -20.
Primera generación Generación final
M edoide
0 50 100 150 200 250 300 350 400
-0.
0
1
Ángulo
vector característico
La Figura 4.8 muestra el comportamiento del enrolado 35. Que se utilizará en el nodo de entrada de la red neuronal individual tipo Radial Basis que finalmente tomará una decisión respecto a la autenticidad del grafo a prueba.
4.3.3 Almacenamiento de Datos
Para este proyecto decidimos conservar todos los datos obtenidos desde la adquisición, por lo que
asociados a éstas.
Las firmas digitales se encuentran en un sistema ficheros de formato JPG ordenados de acuerdo al número asignado al enrolado y al número de rubrica de que se trate de 1 a 7 en orden ascendente con los prefijos “o” y “f” de acuerdo al tipo de firma del que se tratara original o falsificación.
Los vectores de características también se encuentran ordenados en forma similar.
Tenemos dos conjuntos de estos vectores: Uno que contiene toda la información en frecuencia correspondiente al grafo en cuestión. El otro que conserva solamente la información que de acuerdo al algoritmo genético aplicado se consideró como relevante para el análisis de las firmas.
Todos los archivos se encuentran en el árbol de carpetas que se describe a continuación
bd firmas Escaneadas Almacén de hojas de formato escaneadas Firmas ES Contiene firmas JPG recortadas M Máscaras de submuestreo RB Contiene centroides, matrices de pesos (W), ( ) y desviaciones estándar (ds) VC Vectores de características
Al realizar la fase de verificación en la red neuronal para cada firma se obtuvo un único valor resultante. Este valor se comparó con el umbral. Cuando el resultado fue mayor, entonces se corroboró que la firma era original, cuando fue menor se consideró como una falsificación.
Para el análisis de resultados se propuso, probar el sistema con varios umbrales. Para obtener dichos valores de umbral se realizaron tanto incrementos como decrementos en porcentaje del valor máximo obtenido al probar en la red neuronal 4 Firmas Falsificadas Entrenadas.
Los resultados obtenidos se muestran en la tabla siguiente:
umbral FR FA skill FA random
Como se muestra en la Tabla de Resultados , el porcentaje de Falsa Aceptación obtenido para las
plantilla se traslapa con la distribución de la plantilla genuina en muy poca área. Este resultado se logró gracias a que para el cálculo del umbral incluimos 4 firmas aleatorias, que afectaron el valor del umbral de tal forma que la mayoría de las firmas aleatorias fuera rechazada.
De la misma manera se observa que mientras menor sea el porcentaje en que se afecta al umbral, la tasa de falso rechazo ( FR ) disminuye sin embargo ésta no disminuye en forma lineal, como se observa en la gráfica Figura 4.10. La gráfica muestra la relación inversa entre la tasa de falso rechazo y las falsas aceptaciones tanto para falsificaciones entrenadas como para falsificaciones aleatorias. La gráfica ilustra que la caída en la tasa de falsa aceptación para falsificaciones aleatorias cae de manera prácticamente lineal con una pendiente moderada. El caso de la tasa de falsas aceptaciones para falsificaciones entrenadas cae rápidamente para estabilizarse pasando el punto de cruce (Equal Error Rate) con la gráfica de tasa de falsos rechazos.
es como se suponía inversa a FR ya que su comportamiento muestra que entre más bajo es el umbral es más alto este índice. Llegando a un total de 26.83%; también ilustrado en la Figura 4.10.
Figura 4.10. Representación gráfica del comportamiento de sistema con respecto a incremento del valor máximo obtenido ( umbral) al probar el sistema con 8 firmas autógrafas; compuesta con 4 firmas aleatorias y 4 firmas falsificadas.
0.00%
5.00%
10.00%
15.00%
20.00%
25.00%
30.00%