Базовая техника Android FaceDetector - PullRequest
30 голосов
/ 28 июля 2010

Я внедряю трекер лица на Android, и в качестве литературного исследования хотел бы определить основную технику Android FaceDetector.

Проще говоря: я хочу понять, как работает классификатор android.media.FaceDetector.

Краткий поиск в Google не дал ничего информативного, поэтому я решил взглянуть на код.

Посмотрев на исходный код Java, FaceDetector.java, узнать особо нечего: FaceDetector - это просто класс, который предоставляет размеры изображения и количество граней, а затем возвращает массив граней.

Источник Android содержит код JNI для этого класса . Я прошел через вызовы функций, где, сведя до самого необходимого, я узнал:

  1. «FaceFinder» создается в FaceFinder.c:75
  2. В строке 90 bbs_MemSeg_alloc возвращает объект btk_HFaceFinder (который содержит функцию для фактического поиска лиц), по сути, копируя его в массив hsdkA->contextE.memTblE.espArrE исходного объекта btk_HSDK, инициализированного в initialize () (FaceDetector_jni.cpp:145) btk_SDK_create()
  3. Похоже, что лабиринт функций предоставляет друг другу указатели и экземпляры btk_HSDK, но нигде я не могу найти конкретный экземпляр sdk->contextE.memTblE.espArrE[0], который предположительно содержит магию.

То, что я обнаружил , является небольшой подсказкой: код JNI ссылается на библиотеку FFTEm, для которой я не могу найти исходный код. Однако, судя по всему, БПФ представляет собой быстрое преобразование Фурье , которое, вероятно, используется вместе с предварительно обученной нейронной сетью. Единственная литература, которую я могу найти, которая согласуется с этой теорией - это статья Бен-Якуба и др.

Я даже не знаю, нахожусь ли я на правильном пути, поэтому любые предложения, несомненно, помогут.

Редактировать: Я добавил +100 к награде за каждого, кто может дать любую информацию.

Ответы [ 3 ]

4 голосов
/ 12 августа 2010
3 голосов
/ 14 августа 2010

Я разговариваю по телефону, поэтому не могу ответить всесторонне, но ключевые слова Google "алгоритм neven vision" выдают полезные документы ...

Также, Патент США 6222939

Возможно, некоторые ссылки на http://peterwilliams97.blogspot.com/2008/09/google-picasa-to-have-face-recognition.html могут быть полезны ...

0 голосов
/ 13 августа 2010

посмотрите на это: http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=1562271

Я думаю, что однажды я видел какой-то код Matlab, делающий это в презентации.Может быть, это где-то в сети.

Привет, Ларс

...