Понимание проблемы познавательной способности текстуры пищи - PullRequest
0 голосов
/ 11 мая 2019

Входное изображение BMP (24-битный RGB) содержит один из трех типов продуктов питания из данного набора (Таблица 1).Ваша задача - распознать еду и распечатать в окне консоли трехсимвольный код, указанный в таблице 1.

Распознавание должно выполняться в два / три шага:

  1. Подготовкагистограммы заданной цветовой составляющей (таблица 1).Гистограмма содержит количество пикселей для каждого значения данного компонента цвета.
  2. На основе гистограммы должен быть рассчитан режим.Режим набора значений данных - это значение, которое появляется чаще всего.
  3. Диапазоны режимов изображений, относящихся к разным типам продуктов питания, различны.Таким образом, вы можете принять решение, к какому типу продуктов должно быть отнесено изображение.

Входные данные
BMP-файл, содержащий исходное изображение:
- субформат: 24-битный RGB - без сжатия,
- размер: ширина 200 пикселей, высотадо 200 пикселей,
- имя файла: «source.bmp»

Вывод
- окно консоли - обычный текст
enter image description here

Не думаю, что я ясно понял проблему.

Я понял следующее:

  1. Каждый продукт имеет свой основной основной цвет-компонент (и, следовательно, фиксированное значение режима этого конкретного компонента цвета).Во-первых, мне нужно вычислить все значения режима и использовать их в качестве констант в моей программе.
  2. Когда мне дают образец изображения в качестве входа, 1-й, мне нужно увидеть, какой компонент является основным (на основе его значения режима).
  3. Затем мне нужно сравнить это значение режима с ранее вычисленными значениями постоянного режима.
  4. Ближайший соответствует еде.

Я прав?

Если это так, какова цель этой таблицы с 12 строками?Для чего это дано?

Особенно, взгляните на 11-ую строку таблицы, где все картинки красные, но с зеленой составляющей.

...