Interpretation of partial fingermarks using an automated fingerprint identification system
Details
State: Public
Version: After imprimatur
Serval ID
serval:BIB_25F6DAD7F893
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Interpretation of partial fingermarks using an automated fingerprint identification system
Director(s)
Champod Christophe
Institution details
Université de Lausanne, Faculté de droit et des sciences criminelles
Publication state
Accepted
Issued date
03/2009
Language
english
Number of pages
264
Abstract
Abstract :
In the subject of fingerprints, the rise of computers tools made it possible to create
powerful automated search algorithms. These algorithms allow, inter alia, to compare
a fingermark to a fingerprint database and therefore to establish a link between
the mark and a known source. With the growth of the capacities of these systems
and of data storage, as well as increasing collaboration between police services on
the international level, the size of these databases increases. The current challenge
for the field of fingerprint identification consists of the growth of these databases,
which makes it possible to find impressions that are very similar but coming from
distinct fingers. However and simultaneously, this data and these systems allow a
description of the variability between different impressions from a same finger and
between impressions from different fingers. This statistical description of the withinand
between-finger variabilities computed on the basis of minutiae and their relative
positions can then be utilized in a statistical approach to interpretation. The computation
of a likelihood ratio, employing simultaneously the comparison between
the mark and the print of the case, the within-variability of the suspects' finger and
the between-variability of the mark with respect to a database, can then be based
on representative data. Thus, these data allow an evaluation which may be more
detailed than that obtained by the application of rules established long before the
advent of these large databases or by the specialists experience.
The goal of the present thesis is to evaluate likelihood ratios, computed based on
the scores of an automated fingerprint identification system when the source of the
tested and compared marks is known. These ratios must support the hypothesis
which it is known to be true. Moreover, they should support this hypothesis more
and more strongly with the addition of information in the form of additional minutiae.
For the modeling of within- and between-variability, the necessary data were
defined, and acquired for one finger of a first donor, and two fingers of a second
donor. The database used for between-variability includes approximately 600000
inked prints. The minimal number of observations necessary for a robust estimation
was determined for the two distributions used. Factors which influence these
distributions were also analyzed: the number of minutiae included in the configuration
and the configuration as such for both distributions, as well as the finger
number and the general pattern for between-variability, and the orientation of the
minutiae for within-variability. In the present study, the only factor for which no
influence has been shown is the orientation of minutiae
The results show that the likelihood ratios resulting from the use of the scores
of an AFIS can be used for evaluation. Relatively low rates of likelihood ratios
supporting the hypothesis known to be false have been obtained. The maximum
rate of likelihood ratios supporting the hypothesis that the two impressions were
left by the same finger when the impressions came from different fingers obtained
is of 5.2 %, for a configuration of 6 minutiae. When a 7th then an 8th minutia
are added, this rate lowers to 3.2 %, then to 0.8 %. In parallel, for these same
configurations, the likelihood ratios obtained are on average of the order of 100,1000,
and 10000 for 6,7 and 8 minutiae when the two impressions come from the same
finger. These likelihood ratios can therefore be an important aid for decision making.
Both positive evolutions linked to the addition of minutiae (a drop in the rates of
likelihood ratios which can lead to an erroneous decision and an increase in the value
of the likelihood ratio) were observed in a systematic way within the framework of
the study. Approximations based on 3 scores for within-variability and on 10 scores
for between-variability were found, and showed satisfactory results.
Résumé :
Dans le domaine des empreintes digitales, l'essor des outils informatisés a permis de
créer de puissants algorithmes de recherche automatique. Ces algorithmes permettent,
entre autres, de comparer une trace à une banque de données d'empreintes
digitales de source connue. Ainsi, le lien entre la trace et l'une de ces sources peut
être établi. Avec la croissance des capacités de ces systèmes, des potentiels de stockage
de données, ainsi qu'avec une collaboration accrue au niveau international entre
les services de police, la taille des banques de données augmente. Le défi actuel pour
le domaine de l'identification par empreintes digitales consiste en la croissance de ces
banques de données, qui peut permettre de trouver des impressions très similaires
mais provenant de doigts distincts. Toutefois et simultanément, ces données et ces
systèmes permettent une description des variabilités entre différentes appositions
d'un même doigt, et entre les appositions de différents doigts, basées sur des larges
quantités de données. Cette description statistique de l'intra- et de l'intervariabilité
calculée à partir des minuties et de leurs positions relatives va s'insérer dans une
approche d'interprétation probabiliste. Le calcul d'un rapport de vraisemblance,
qui fait intervenir simultanément la comparaison entre la trace et l'empreinte du
cas, ainsi que l'intravariabilité du doigt du suspect et l'intervariabilité de la trace
par rapport à une banque de données, peut alors se baser sur des jeux de données
représentatifs. Ainsi, ces données permettent d'aboutir à une évaluation beaucoup
plus fine que celle obtenue par l'application de règles établies bien avant l'avènement
de ces grandes banques ou par la seule expérience du spécialiste.
L'objectif de la présente thèse est d'évaluer des rapports de vraisemblance calcul
és à partir des scores d'un système automatique lorsqu'on connaît la source des
traces testées et comparées. Ces rapports doivent soutenir l'hypothèse dont il est
connu qu'elle est vraie. De plus, ils devraient soutenir de plus en plus fortement
cette hypothèse avec l'ajout d'information sous la forme de minuties additionnelles.
Pour la modélisation de l'intra- et l'intervariabilité, les données nécessaires ont été
définies, et acquises pour un doigt d'un premier donneur, et deux doigts d'un second
donneur. La banque de données utilisée pour l'intervariabilité inclut environ 600000
empreintes encrées. Le nombre minimal d'observations nécessaire pour une estimation
robuste a été déterminé pour les deux distributions utilisées. Des facteurs qui
influencent ces distributions ont, par la suite, été analysés: le nombre de minuties
inclus dans la configuration et la configuration en tant que telle pour les deux distributions,
ainsi que le numéro du doigt et le dessin général pour l'intervariabilité, et la
orientation des minuties pour l'intravariabilité. Parmi tous ces facteurs, l'orientation
des minuties est le seul dont une influence n'a pas été démontrée dans la présente
étude.
Les résultats montrent que les rapports de vraisemblance issus de l'utilisation des
scores de l'AFIS peuvent être utilisés à des fins évaluatifs. Des taux de rapports
de vraisemblance relativement bas soutiennent l'hypothèse que l'on sait fausse. Le
taux maximal de rapports de vraisemblance soutenant l'hypothèse que les deux
impressions aient été laissées par le même doigt alors qu'en réalité les impressions
viennent de doigts différents obtenu est de 5.2%, pour une configuration de 6 minuties.
Lorsqu'une 7ème puis une 8ème minutie sont ajoutées, ce taux baisse d'abord
à 3.2%, puis à 0.8%. Parallèlement, pour ces mêmes configurations, les rapports
de vraisemblance sont en moyenne de l'ordre de 100, 1000, et 10000 pour 6, 7 et
8 minuties lorsque les deux impressions proviennent du même doigt. Ces rapports
de vraisemblance peuvent donc apporter un soutien important à la prise de décision.
Les deux évolutions positives liées à l'ajout de minuties (baisse des taux qui
peuvent amener à une décision erronée et augmentation de la valeur du rapport de
vraisemblance) ont été observées de façon systématique dans le cadre de l'étude.
Des approximations basées sur 3 scores pour l'intravariabilité et sur 10 scores pour
l'intervariabilité ont été trouvées, et ont montré des résultats satisfaisants.
In the subject of fingerprints, the rise of computers tools made it possible to create
powerful automated search algorithms. These algorithms allow, inter alia, to compare
a fingermark to a fingerprint database and therefore to establish a link between
the mark and a known source. With the growth of the capacities of these systems
and of data storage, as well as increasing collaboration between police services on
the international level, the size of these databases increases. The current challenge
for the field of fingerprint identification consists of the growth of these databases,
which makes it possible to find impressions that are very similar but coming from
distinct fingers. However and simultaneously, this data and these systems allow a
description of the variability between different impressions from a same finger and
between impressions from different fingers. This statistical description of the withinand
between-finger variabilities computed on the basis of minutiae and their relative
positions can then be utilized in a statistical approach to interpretation. The computation
of a likelihood ratio, employing simultaneously the comparison between
the mark and the print of the case, the within-variability of the suspects' finger and
the between-variability of the mark with respect to a database, can then be based
on representative data. Thus, these data allow an evaluation which may be more
detailed than that obtained by the application of rules established long before the
advent of these large databases or by the specialists experience.
The goal of the present thesis is to evaluate likelihood ratios, computed based on
the scores of an automated fingerprint identification system when the source of the
tested and compared marks is known. These ratios must support the hypothesis
which it is known to be true. Moreover, they should support this hypothesis more
and more strongly with the addition of information in the form of additional minutiae.
For the modeling of within- and between-variability, the necessary data were
defined, and acquired for one finger of a first donor, and two fingers of a second
donor. The database used for between-variability includes approximately 600000
inked prints. The minimal number of observations necessary for a robust estimation
was determined for the two distributions used. Factors which influence these
distributions were also analyzed: the number of minutiae included in the configuration
and the configuration as such for both distributions, as well as the finger
number and the general pattern for between-variability, and the orientation of the
minutiae for within-variability. In the present study, the only factor for which no
influence has been shown is the orientation of minutiae
The results show that the likelihood ratios resulting from the use of the scores
of an AFIS can be used for evaluation. Relatively low rates of likelihood ratios
supporting the hypothesis known to be false have been obtained. The maximum
rate of likelihood ratios supporting the hypothesis that the two impressions were
left by the same finger when the impressions came from different fingers obtained
is of 5.2 %, for a configuration of 6 minutiae. When a 7th then an 8th minutia
are added, this rate lowers to 3.2 %, then to 0.8 %. In parallel, for these same
configurations, the likelihood ratios obtained are on average of the order of 100,1000,
and 10000 for 6,7 and 8 minutiae when the two impressions come from the same
finger. These likelihood ratios can therefore be an important aid for decision making.
Both positive evolutions linked to the addition of minutiae (a drop in the rates of
likelihood ratios which can lead to an erroneous decision and an increase in the value
of the likelihood ratio) were observed in a systematic way within the framework of
the study. Approximations based on 3 scores for within-variability and on 10 scores
for between-variability were found, and showed satisfactory results.
Résumé :
Dans le domaine des empreintes digitales, l'essor des outils informatisés a permis de
créer de puissants algorithmes de recherche automatique. Ces algorithmes permettent,
entre autres, de comparer une trace à une banque de données d'empreintes
digitales de source connue. Ainsi, le lien entre la trace et l'une de ces sources peut
être établi. Avec la croissance des capacités de ces systèmes, des potentiels de stockage
de données, ainsi qu'avec une collaboration accrue au niveau international entre
les services de police, la taille des banques de données augmente. Le défi actuel pour
le domaine de l'identification par empreintes digitales consiste en la croissance de ces
banques de données, qui peut permettre de trouver des impressions très similaires
mais provenant de doigts distincts. Toutefois et simultanément, ces données et ces
systèmes permettent une description des variabilités entre différentes appositions
d'un même doigt, et entre les appositions de différents doigts, basées sur des larges
quantités de données. Cette description statistique de l'intra- et de l'intervariabilité
calculée à partir des minuties et de leurs positions relatives va s'insérer dans une
approche d'interprétation probabiliste. Le calcul d'un rapport de vraisemblance,
qui fait intervenir simultanément la comparaison entre la trace et l'empreinte du
cas, ainsi que l'intravariabilité du doigt du suspect et l'intervariabilité de la trace
par rapport à une banque de données, peut alors se baser sur des jeux de données
représentatifs. Ainsi, ces données permettent d'aboutir à une évaluation beaucoup
plus fine que celle obtenue par l'application de règles établies bien avant l'avènement
de ces grandes banques ou par la seule expérience du spécialiste.
L'objectif de la présente thèse est d'évaluer des rapports de vraisemblance calcul
és à partir des scores d'un système automatique lorsqu'on connaît la source des
traces testées et comparées. Ces rapports doivent soutenir l'hypothèse dont il est
connu qu'elle est vraie. De plus, ils devraient soutenir de plus en plus fortement
cette hypothèse avec l'ajout d'information sous la forme de minuties additionnelles.
Pour la modélisation de l'intra- et l'intervariabilité, les données nécessaires ont été
définies, et acquises pour un doigt d'un premier donneur, et deux doigts d'un second
donneur. La banque de données utilisée pour l'intervariabilité inclut environ 600000
empreintes encrées. Le nombre minimal d'observations nécessaire pour une estimation
robuste a été déterminé pour les deux distributions utilisées. Des facteurs qui
influencent ces distributions ont, par la suite, été analysés: le nombre de minuties
inclus dans la configuration et la configuration en tant que telle pour les deux distributions,
ainsi que le numéro du doigt et le dessin général pour l'intervariabilité, et la
orientation des minuties pour l'intravariabilité. Parmi tous ces facteurs, l'orientation
des minuties est le seul dont une influence n'a pas été démontrée dans la présente
étude.
Les résultats montrent que les rapports de vraisemblance issus de l'utilisation des
scores de l'AFIS peuvent être utilisés à des fins évaluatifs. Des taux de rapports
de vraisemblance relativement bas soutiennent l'hypothèse que l'on sait fausse. Le
taux maximal de rapports de vraisemblance soutenant l'hypothèse que les deux
impressions aient été laissées par le même doigt alors qu'en réalité les impressions
viennent de doigts différents obtenu est de 5.2%, pour une configuration de 6 minuties.
Lorsqu'une 7ème puis une 8ème minutie sont ajoutées, ce taux baisse d'abord
à 3.2%, puis à 0.8%. Parallèlement, pour ces mêmes configurations, les rapports
de vraisemblance sont en moyenne de l'ordre de 100, 1000, et 10000 pour 6, 7 et
8 minuties lorsque les deux impressions proviennent du même doigt. Ces rapports
de vraisemblance peuvent donc apporter un soutien important à la prise de décision.
Les deux évolutions positives liées à l'ajout de minuties (baisse des taux qui
peuvent amener à une décision erronée et augmentation de la valeur du rapport de
vraisemblance) ont été observées de façon systématique dans le cadre de l'étude.
Des approximations basées sur 3 scores pour l'intravariabilité et sur 10 scores pour
l'intervariabilité ont été trouvées, et ont montré des résultats satisfaisants.
Keywords
fingerprints, likelihood ratio, AFIS, within variability, between variability
Create date
02/09/2009 8:43
Last modification date
20/08/2019 13:04