Как я могу автоматически характеризовать диаграммы рассеяния связанных наборов данных?Примеры включены - PullRequest
1 голос
/ 15 декабря 2011

Данные испытаний по длине (ось X) одной партии нашего продукта.

Я пытаюсь как-то охарактеризовать эти данные. Каждая партия имеет график разброса значений одинаковой формы, но они различаются по масштабу и расположению вдоль оси y. Вот другая партия продукта, показывающая виды ожидаемых отличий .

Данные не могут быть вписаны в полиномиальную функцию из-за этих двух пиков при x = 15 и x = 115, хотя полином 6-й или 7-й степени является достойным приближением.

Итак: есть ли у вас какие-либо идеи, как я мог бы создать какую-то функцию, которая описывает этот шаблон, используя переменные для масштаба и местоположения на оси Y?

Ожидается, что данные будут разбиты по середине примерно на x = 57, поскольку произведение симметрично, хотя могут быть случаи, когда одна сторона имеет значения, которые не полностью соответствуют другой.

Спасибо за вашу помощь.

Ответы [ 3 ]

0 голосов
/ 16 декабря 2011

Вы можете представить себе, что ваша проблема разбита на две части:

  1. Найдите правильную функцию
  2. Установите функцию для данных

Поиск правильной функции - это больше искусство, чем наука.Как вы указали, полином высокой степени может соответствовать вашим данным.Полином произвольной степени может соответствовать любой кривой в данной области!Это может быть не самая лучшая модель для ваших данных, но она даст вам фантастическое соответствие.

Что вам нужно, чтобы иметь возможность сравнивать два результата?Вас больше интересует шум?Вас интересует высота вершин?Производная сглаженной функции?Расположение вершин?Ответ на этот вопрос расскажет вам, как лучше всего найти правильную функцию.Хороший портал для дальнейших деталей: http://en.wikipedia.org/wiki/Model_selection

Что касается второй части, то подгонка функции на самом деле довольно проста.Если у вас есть относительно низкоразмерная функция, вы можете использовать fminsearch, чтобы найти «оптимальные» параметры.Это даст вам локальный минимум, но, основываясь на опыте, он проделает довольно хорошую работу!

0 голосов
/ 16 декабря 2011

Вы пытаетесь охарактеризовать один набор данных (то есть данные, нанесенные на один набор осей) или вас больше интересует , характеризующий дисперсию между различными партиями ? Когда я прочитал твой Вопрос, мне показалось, что это последнее, но ответы до сих пор, кажется, предполагают первое.

Если это действительно последнее, то это обычная задача анализа временных рядов (т. Е. остаточный анализ), этапы которого:

  • , если один набор данных является разумным эталоном (т. Е. откалиброванная партия), затем используйте отметку как таковую;

  • если нет, то создайте эталонный тест, рассчитав средний вектор из всех каждый набор данных;

  • для каждого набора данных, рассчитать вектор дисперсии (или абсолютный вектор дисперсии) и нанесите его на график - это невязки ;

  • наконец, вы можете рассчитать среднюю абсолютную дисперсию для всех данных наборы и сюжет.

0 голосов
/ 16 декабря 2011

Если x = 15 и x = 115 являются константами, вы можете разделить данные на 3 части и затем использовать 3 простые функции.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...