Record Details

Estimation of quality of a small sampling biometric data using a more efficient form of the chi-square test

Dependability

View Archive Info
 
 
Field Value
 
Title Estimation of quality of a small sampling biometric data using a more efficient form of the chi-square test
Оценка качества малой выборки биометрических данных с использованием более экономичной формы хи-квадрат критерия
 
Creator B. Akhmetov B.; International Informatization Academy (IIA), Turkestan, Kazakhstan
A. Ivanov I.; Laboratory of biometric and neural network technologies, JSC Penza Research Electric and Technical Institute, Penza, Russia
Б. Ахметов Б.; Международная академия информатизации (МАИН), Туркестан, Казахстан
А. Иванов И.; лаборатория биометрических и нейросетевых технологий ОАО «Пензенский научно-исследовательский электротехнический институт», Пенза, Россия
 
Subject multivariate statistical analysis; chi-square test; small samplings of test biometric data.
многомерный статистический анализ;хи-квадрат критерий;малые выборки тестовых биометрических данных
 
Description Aim. The purpose is to increase the power of the Pearson’s chi-square test so that this test will become efficient on small test samplings. . It is necessary to reduce the scope of a test sample from 200 examples to 20 examples while maintaining the probability of errors of the first and the second kind. Selection of 20 examples of biometric images is considered by users to be a comfortable level of effort. The need to select more examples is perceived by users negatively.Methods. The article offers one more (the second) form of the Pearson test that is much less sensitive to the scope of data in a test sampling. It is shown that a traditional form of the chi-square test is more sensitive to the scope of a test sampling than the Cramer-von Mises test. The offered (second) form of the chi-square test is less sensitive to the scope of a test sampling than a classical form of the chi-square test and less sensitive than the Cramer-von Mises test as well. This effect is achieved by the transition from the space of frequency of occurrence of events and probabilities of a group of similar events occurring in the space of more accurately evaluated junior statistical moments (mean and standard deviation). The fractal dimension of the new synthetic form of chi-square test coincides with the fractal dimension of the classical form of the chi-square test.Results. The offered second variant of the chisquare test is presumably one of the most powerful of all existing statistical tests. The analytical description of correlation of standard deviations of a classical form of the chi-square test and a new form of the chi-square test is given. The standard deviation of the second form of the chi-square test decreases by half on retention of a statistical expectation on samplings of the same scope. The latter is equivalent to a four-time reduction of the requirements to the scope of a test sampling within the interval from 16 to 20 examples. Power gain as the result of the application of a new test is growing with the growth of a test sampling scope.Conclusions. When creating a classical chi-square test in 1900, Pearson was guided by limited computing opportunities of the existing computer facilities, and he had to rely on the analytical relations that he found. Today the situation has changed and there are no more restrictions in relation to the engaged computing resources. However we continue to rely on those created with computing resources of 1900 by inertia. Probably, we should try to consider modern opportunities of computer facilities and to build more powerful options of statistical tests. Even if new tests will require a search of large number of possible states (they will have big tables calculated in advance instead of analytical relations), it is not a constraining factor today. When data is insufficient (in biometrics, in medicine, in economy) a computing complexity of statistical tests does not play a special role if the result of estimations is more accurate.
Цель. Поставлена цель повышения мощности хи-квадрат критерия Пирсона с тем, чтобы этот критерий стал работоспособен на тестовых выборках биометрических данных малого объема. Необходимо снизить объем тестовой выборки с 200 примеров до 20 примеров при сохранении вероятностей ошибок первого и второго рода. Сбор 20 примеров биометрических образов рассматривается пользователями как комфортный уровень трудозатрат. Необходимость сбора большего числа примеров воспринимается пользователями негативно.Методы. В статье предложена еще одна (вторая) форма критерия Пирсона гораздо менее чувствительная к объему данных в тестовой выборке. Показано, что традиционная форма хи-квадрат критерия чувствительнее к объему тестовой выборки, чем критерий Крамера фон-Мизеса. Предложенная (вторая) форма хи-квадрат критерия имеет чувствительность к объему тестовой выборки меньше чем чувствительность у классического хи-квадрат критерия и меньше, чем чувствительность у критерия Крамера-фон Мизеса одновременно. Этот эффект достигнут переходом из пространства частот появления событий и вероятностей появления группы похожих событий в пространство более точно оцениваемых младших статистических моментов (математического ожидания и стандартного отклонения). Фрактальная размерность новой синтезированной формы хи-квадрат критерия совпадает с фрактальной размерностью классической формы хи-квадрат критерия.Результаты. Предположительно, что предложенный в статье еще один вариант хи-квадрат критерия является одним из самых мощных из всех существующих статистических критериев. Дано аналитическое описание соотношения стандартных отклонений классической формы хи-квадрат критерия и новой формы хи-квадрат критерия. Стандартное отклонение второй формы хи-квадрат критерия уменьшается примерно в 2 раза при сохранении математического ожидания на выборках одинакового объема. Последнее эквивалентно четырехкратному снижению требований к объему тестовой выборки в интервале от 16 до 20 примеров. Выигрыш по мощности от применения нового критерия растет по мере роста объема тестовой выборки.Выводы. Пирсон при создании в 1900 году классического хи-квадрат критерия ориентировался на ограниченные вычислительные возможности, существовавшей тогда вычислительной техники, и был вынужден опираться на найденные им аналитические соотношения. Сегодня ситуация изменилась, ограничения на привлекаемые вычислительные ресурсы исчезли. Однако мы продолжаем по инерции опираться на то, что было создано под вычислительные ресурсы 1900 года. Видимо, следует пытаться учитывать современные возможности вычислительной техники и строить более мощные варианты статистических критериев. Даже если новые критерии будут требовать перебора большого числа возможных состояний (будут иметь большие заранее вычисленные таблицы вместо аналитических соотношений) это сегодня не является сдерживающим фактором. Когда данных недостаточно (в биометрии, в медицине, в экономике) вычислительная сложность статистических критериев не играет особой роли, если результат оценок оказывается более точным.
 
Publisher LLC Journal Dependability
 
Contributor

 
Date 2016-09-13
 
Type info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion


 
Format application/pdf
application/pdf
 
Identifier http://www.dependability.ru/jour/article/view/154
 
Source Dependability; № 2 (2016); 43-48
Надежность; № 2 (2016); 43-48
1729-2646
 
Language rus
eng
 
Relation http://www.dependability.ru/jour/article/view/154/299
http://www.dependability.ru/jour/article/view/154/309
Ramírez-Ruiz J., Pfeiffer C., Nolazco-Flores J. Cryptographic Keys Generation Using FingerCodes. // Advances in Artificial Intelligence – IBERAMIA-SBIA 2006 (LNCS 4140), p. 178-187, 2006
Monrose F., Reiter M., Li Q., Wetzel S. Cryptographic key generation from voice. In Proc. IEEE Symp. on Security and Privacy, 2001
Feng Hao, Ross Anderson and John Daugman. Crypto with Biometrics Effectively, IEEE TRANSACTIONS ON COMPUTERS, VOL. 55, NO. 9, SEPTEMBER 2006.
Язов Ю.К. и др. Нейросетевая защита персональных биометрических данных. // Ю.К.Язов (редактор и автор), соавторы В.И. Волчихин, А.И. Иванов, В.А. Фунтиков, И.Г. Назаров // М.: Радиотехника, 2012 г. 157 с. IBSN 978-5-88070-044-8.
Ахметов Б.С., Иванов А.И., Фунтиков В.А., Безяев А.В., Малыгина Е.А. Технология использования больших нейронных сетей для преобразования нечетких биометрических данных в код ключа доступа. Монография, Казахстан, г. Алматы, ТОО «Издательство LEM», 2014 г. -144 c.
Ахметов Б.С., Волчихин В.И., Иванов А.И., Малыгин А.Ю. Алгоритмы тестирования биометрико-нейросетевых механизмов защиты информации Казахстан, Алматы, КазНТУ им. Сатпаева, 2013 г.- 152 с. ISBN 978-101-228-586-4.
Кобзарь А.И. Прикладная математическая статистика для инженеров и научных работников. М. ФИЗМАТЛИТ, 2006 г., 816 с.
Р 50.1.037-2002 Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа χ2. Госстандарт России. Москва-2001 г., 140 с.
Ахметов Б.С., Иванов А.И., Серикова Н.И., Фунтикова Ю.В. Алгоритм искусственного повышения числа степеней свободы при анализе биометрических данных по критерию согласия хи-квадрат. Вестник национальной академии наук республики Казахстан. №5, 2014 г. с. 28-:-34.
Серикова. Н.И., Иванов А.И., Качалин С.В. Биометрическая статистика: сглаживание гистограмм, построенных на малой обучающей выборке. /Вестник СибГАУ 2014 № 3(55) с.146-150.
Ахметов Б.Б., Иванов А.И., Безяев А.В., Фунтикова Ю.В. Многомерный статистический анализ биометрических данных сетью частных критериев Пирсона. // Вестник Национальной академии наук Республики Казахстан. – Алматы, 2015. № 1. С. 5-11.
 
Rights Authors who publish with this journal agree to the following terms:Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).
Авторы, публикующие в данном журнале, соглашаются со следующим:Авторы сохраняют за собой авторские права на работу и предоставляют журналу право первой публикации работы на условиях лицензии Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.Авторы сохраняют право заключать отдельные контрактные договорённости, касающиеся не-эксклюзивного распространения версии работы в опубликованном здесь виде (например, размещение ее в институтском хранилище, публикацию в книге), со ссылкой на ее оригинальную публикацию в этом журнале.Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).