Сортировать список лет в ячейке в openrefine - PullRequest
0 голосов
/ 17 октября 2018

как в названии, у меня есть набор данных с журналами.Для каждого журнала у меня есть ячейка с этими смешанными датами:

1690 - 1686 - 1716 - 1726 - 1683 - 1730 - 1684 - 1715 - 1693 - 1712 -1695 - 1688 - 1724 - 1685 - 1692 - 1707 - 1702 - 1731 - 1710 - 1709 - 1704 - 1696 - 1687 - 1699 - 1708 - 1703 - 1691 -- 1697 - 1720 - 1694 - 1714 - 1729 - 1721 - 1713 - 1725 - 1705 - 1727 - 1711 - 1719 - 1728 - 1723 - 1717 - 1718 - 1700- 1689 - 1722 - 1701 - 1698 - 1706

Как отсортировать даты и взять только первые и последние даты публикации?

Заранее спасибо

1 Ответ

0 голосов
/ 17 октября 2018

Я не совсем уверен, что вам нужно, но если я правильно читаю, то это должно сделать это:

value.split(' -- ').sort()[0]
value.split(' -- ').sort()[-1]

Первый дает вам самое низкое значение, второй самый высокийзначение.Для этих данных вы получаете 1683 и 1731.

. Вы можете использовать «Добавить столбец на основе этого столбца» дважды, чтобы получить начальный и конечный годы в разных ячейках, или вы можете снова объединить значения с помощью «+»., вот так:

value.split(' -- ').sort()[0] + "-" + value.split(' -- ').sort()[-1]
...