Выбор данных из таблицы в Mathematica - PullRequest
3 голосов
/ 15 ноября 2010

Я пытаюсь написать функцию, которая будет выбирать первый элемент в таблице, который удовлетворяет критериям.Например, если мне дается следующая таблица со временем в первом столбце и числом людей, зараженных болезнью, во втором, я хочу написать аргумент, который будет возвращать время, когда заражено не менее 100 человек.

0   1
1   2
2   4
3   8
4   15
5   29
6   50
7   88
8   130
9   157
10  180
11  191
12  196
13  199
14  200

Итак, из этой таблицы я хочу, чтобы аргумент сообщил мне, что за 8 секунд заразилось не менее 100 человек.Я попытался использовать SELECT, чтобы сделать это, но я не уверен, как использовать SELECT с таблицей из 2 столбцов и заставить его вернуть значение в первом столбце на основе критериев из второго столбца.

Ответы [ 4 ]

3 голосов
/ 15 ноября 2010

Альтернативой, которая использует правила замены, является

ImportString["0 1 1 2 2 4 3 8 4 15 5 29 6 50 7 88 8 130 9 157 10 180 11 191 12 196 13 199 14 200", "Table"];
Partition[Flatten[%], 2]
% /. {___, x : {_, _?(# >= 100 &)}, ___} :> x

Алгоритм, с помощью которого Mathematica ищет шаблоны, гарантирует, что это вернет первый такой случай. Если вы хотите все случаи, то вы можете использовать ReplaceList. Я предлагаю вам прочитать руководство по Patterns и Rules .


Редактировать: ImportString также работает с вновь отформатированными данными - но вам больше не нужно использовать Partition.

3 голосов
/ 15 ноября 2010

Вы также можете использовать простой NestWhile

data = {{0,1},{1,2},{2,4},{3,8},{4,15},{5,29},{6,50},{7,88},{8,130},{9,157},{10,180},
 {11,191},{12,196},{13,199},{14,200}};
NestWhile[# + 1 &, 1, data[[#, 2]] < 100 &] - 1
2 голосов
/ 15 ноября 2010

Вот несколько разных способов сделать это, если я правильно истолковал ваши данные ...

In[3]:= data = {{0,1},{1,2},{2,4},{3,8},{4,15},{5,29},{6,50},{7,88},{8,130},{9,157},{10,180},{11,191},{12,196},{13,199},{14,200}};

In[8]:= Cases[data, {_, _?(#>=100&)}, 1, 1][[1, 1]]
Out[8]= 8

In[9]:= Select[data, #[[2]]>=100&, 1][[1, 1]]
Out[9]= 8

Я предлагаю вам прочитать часть [], чтобы лучше это понять.

1 голос
/ 04 марта 2011

Я считаю, что есть более быстрый способ, чем тот, который уже был дан, но сначала, метод Джошуа Cases можно сделать немного быстрее, используя /; вместо & для теста.

Это решение, которое я предлагаю (отредактируйте: добавив пробел для ясности, поскольку здесь двойные скобки не форматируются):

dat[[
  Position[
    dat[[All, 2]],
    x_ /; x >= 100,
    1, 1
  ][[1, 1]],
  1
]]

Вот время для различных предлагаемых методов. Обратите внимание, что метод /. запускается только один раз, в то время как другие выполняются loops раз. Поэтому в этом первом тесте он в 100 раз медленнее, чем метод Position. Кроме того, метод NestWhile возвращает только индекс, а не фактический элемент первого столбца.

In[]:= 
dat = {Range[5000], Sort@RandomInteger[1*^6, 5000]} // Transpose;
lim = 300000; loops = 100;
dat /. {___, {x_, _?(# >= lim &)}, ___} :> x; // Timing
Do[  Cases[dat, {_, _?(# >= lim &)}, 1, 1][[1, 1]]  , {loops}] // Timing
Do[  Cases[dat, {_, y_ /; y >= lim}, 1, 1][[1, 1]]  , {loops}] // Timing
Do[  Select[dat, #[[2]] >= lim &, 1][[1, 1]]  , {loops}] // Timing
Do[  NestWhile[# + 1 &, 1, dat[[#, 2]] < lim &]  , {loops}] // Timing
Do[  dat[[Position[dat[[All, 2]], x_ /; x >= lim, 1, 1][[1, 1]], 1]]  , {loops}] // Timing

Out[]= {0.125, Null}

Out[]= {0.438, Null}

Out[]= {0.406, Null}

Out[]= {0.469, Null}

Out[]= {0.281, Null}

Out[]= {0.125, Null}

С более длинным столом (я опускаю медленный метод):

In[]:= 
dat = {Range[35000], Sort@RandomInteger[1*^6, 35000]} // Transpose;
lim = 300000; loops = 25;
Do[  Cases[dat, {_, _?(# >= lim &)}, 1, 1][[1, 1]]  , {loops}] // Timing
Do[  Cases[dat, {_, y_ /; y >= lim}, 1, 1][[1, 1]]  , {loops}] // Timing
Do[  Select[dat, #[[2]] >= lim &, 1][[1, 1]]  , {loops}] // Timing
Do[  NestWhile[# + 1 &, 1, dat[[#, 2]] < lim &]  , {loops}] // Timing
Do[  dat[[Position[dat[[All, 2]], x_ /; x >= lim, 1, 1][[1, 1]], 1]]  , {loops}] // Timing

Out[]= {0.734, Null}

Out[]= {0.641, Null}

Out[]= {0.734, Null}

Out[]= {0.5, Null}

Out[]= {0.266, Null}

Наконец, подтверждение соглашения:

In[]:= SameQ[
         Select[dat, #[[2]] >= lim &, 1][[1, 1]],
         dat[[Position[dat[[All, 2]], x_ /; x >= lim, 1, 1][[1, 1]], 1]]
       ]

Out[]= True
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...