: Изграждане на висококвалифицирани млади изследователи по съвременни информационни технологии за оптимизация, разпознаване на образи и подпомагане вземането на решения Минимизиране на броя на признаците за on-line подписи чрез прилагане на статистически методи Десислава Бояджиева докторант в ИИКТ-БАН ИНСТИТУТ ПО ИНФОРМАЦИОННИ И КОМУНИКАЦИОННИ ТЕХНОЛОГИИ - БАН
Бърз преглед Избор на признаци за on-line подписи; Статистически методи Редукция според корелационната матрица; Избор на променливи в регресионния модел. Експеримент Постановка; Графичен потребителски интерфейс; Резултати.
Верификация на подписи Дефиниция; Методи статичен (off-line) и динамичен (on-line); Стъпки; Видове признаци; Видове фалшифицирани подписи (forgeries) със или без познаване на подписа (съответно skilled и random).
Избор на признаци Това е процесът по намирането на k на брой информативни признаци от първоначалните p на брой k p като същевременно се цели откриването и премахването на повтарящата се и излишна информация.
Множествена регресия Нека разполагаме с n k 1 наблюдения над k-мерен вектор от независими променливи xt ( x,..., x ) и зависимата променлива y. 1 k Моделът на множествената регресия се представя с израза: k y x e, j 1,..., n j 0 i ij j i 1 y X e (матричен вид) Регресионните коефициенти, 1,..., k се оценяват чрез МНМК k независими променливи възможни регресионни модела Регресията е метод за изледване на взаимовръзката между независимите променливи и зависимата променлива i i b X X X Y ( T ) 1 T. 2 k
Избор на променливи в регресионния модел Критериите за избор на функции на остатъчната сума от квадрати (RSS) Критерий Cp на Mallows RSSp Cp ( n 2 p) ˆ 2 ˆ n k 2 1 ( y ) 2 j ix n k ij j 1 i 1 2 E( RSS ) ( n p) ˆ E( Cp) p p Добри са подмножествата от променливи, за които стойността на Cp e по-малка от p и близка до p.
Метод на LaMotte и Hocking (1) Базиран е на критерия на Mallows. Разглеждат се само малка част от всичките k подмножества с размер p; p Подмножество от r променливи се премахва от модела, а подмножество от p променливи остава, p r k; Редукцията в RSS от премахването на подмножество от r променливи се дефинира така: Red r RSS p RSS k Подмножество от r променливи, за което тази редукция е наймалка определя съответното подмножество от p променливи, за което RSS е минимална; Статистиката Cp се пресмята чрез тази редукция по следния начин: C Re p d (2 p k). 2 ˆ r
Стъпки: Метод на LaMotte и Hocking (2) Намиране на регресионните коефициенти за всичките k на брой променливи; модела с За всяка променлива се пресмятат редукциите от премахването й (univariate reductions) и променливите се нареждат по нарастващ ред на тези редукции: t t i 2 i ˆ 2 2 i b ˆ 2 i 2 b i Пресмятат се т.нар. m-редукции от премахването на подмножества от m променливи от модела. Подмножествата се означават се чрез ( i, i,..., im), 1 ij k и i i... i ; 1 2 m 1 2
Метод на LaMotte и Hocking (3) Така пресметнатите m-редукции се сортират в нарастващ ред; Дефинират се т.нар. етапи от подмножествата от m елемента с първи индекс r m 1 ; На всеки етап се разглеждат подмножества от r елемента (m на брой елемента от съответното m-подмножество и r-m на брой индекси, по-малки от първия индекс в m- подмножеството); Изобщо, на q-тия етап се изчисляват редукциите от всички дефинирани на съответния етап подмножества от r елемента, и, ако най-малката редукция от всички етапи 1,...,q е по-малка от m-редукцията от премахването на подмножеството m променливи, дефиниращо етап q+1, се счита, че е открито най-доброто r-подмножество, което да се премахне от изходния модел.
Извличане на признаци от графичен таблет Технология Графичен таблет Wacom Intuos3 A5 PTZ-630; Библиотека Microsoft.NET Tablet PC SDK 1.7. Графичен потребителски интерфейс Реализиран на C#; Възможности. Процес.
Графичен потребителски интерфейс (1) Фиг. 1 Начален екран
Графичен потребителски интерфейс (2) Фиг. 2 Eкран събиране на подписи
Графичен потребителски интерфейс (3) спомага бързото събиране на подписи и извличането на признаци; предоставя възможност на потребителя да положи подписа си по естествен за него начин.
Извличане на признаци Табл. 1 Признаци за подписи
Експеримент 140 подписа от 14 души; к = 15 и n = 20 (десет оригинални и десет фалшифицирани). За фалшифицирани се вземат произволни подписи от останалите участници; За всеки участник се създава текстов файл Всеки ред съдържа стойностите на признаците, разделени от ; и завършва с -1 или 1 (съответно за фалшифициран и оригинален подпис); Броят на редовете е n = 20. Статистическият метод се прилага върху всеки от 14-те файла за 3 r 13. За целта е създадено приложение на C#.
Резултати Табл. 2 Най-добри p-подмножества
Интерпретиране на резултатите Не може да се идентифицират общи за всички участници признаци, които да се премахнат; За всеки участник би могло да се определят информативните признаци и те да бъдат обект на разглеждане в процеса на верификацията на подпис.
Бъдеща работа По-голям брой признаци; Включване на фалшифицирани подписи, положени с познаване на подписа; По-голям брой участници.
Благодаря за вниманието!