Использовать строки в качестве индексов срезов в Python? (TypeError: индексы слайса должны быть целыми числами или None или иметь метод __index__) - PullRequest
3 голосов
/ 15 января 2020

У меня есть отсортированный массив:

arr = ['Alexander', 'Belman', 'Erik', 'Nicholas', ... , 'Zahir']

Я хотел бы сделать что-то вроде этого:

arr['B':'M'] # ['Belman', 'Erik']

Как я могу создать класс и реализовать

__getitem__
__index__

правильным способом для достижения этой цели?

Я подумываю использовать что-то вроде

def __getitem__(self, key):
    if isinstance(key, slice):
        return [self.list[i] for i in range(key.start, key.stop)]
    return self.list[key]

, но я не знаю, как индексировать строки. Как я могу создать метод

__index__

, чтобы применить бинарный поиск к self.list и вернуть правильные индексы?

Ответы [ 2 ]

5 голосов
/ 15 января 2020

Я думаю, что вы можете избежать такой простой реализации, как показано ниже:

from collections import UserList

class MyList(UserList):
    def __getitem__(self, key):
        if isinstance(key, slice):
            return [e for e in self.data if key.start <= e < key.stop]
        # TODO implement the rest of the usecases and/or error handling...
        #      for now slicing with integers will miserably fail,
        #      and basic integer indexing returns None

arr = MyList(['Alexander', 'Belman', 'Erik', 'Nicholas', 'Zahir'])
print(arr['B':'M'])

, которая будет выводить

['Belman', 'Erik']

аналогично,

print(arr['Alex':'Er'])

будет выводить

['Alexander', 'Belman']

Обратите внимание, что я использовал key.start <= e < key.stop, чтобы соответствовать поведению inclusive: exclusive ([)), которое используется в python.

Также обратите внимание, что я реализовал только строчные кусочки usecase. Вы можете реализовать другие варианты использования и обработки ошибок, как считаете нужным.

0 голосов
/ 15 января 2020

Я также публикую свое решение с помощью бинарного поиска, используя numpy

class Stock():

    def __init__(self, name, date):
        self.name = name
        self.date = np.array(date)


    def __getitem__(self, key):

        if isinstance(key, slice):
            if key.start is not None and key.stop is not None: 
                return self.date[np.searchsorted(self.date, key.start, side='left', sorter=None):np.searchsorted(self.date, key.stop, side='left', sorter=None)]
            elif key.start is not None:
                return self.date[np.searchsorted(self.date, key.start, side='left', sorter=None):]
            elif key.stop is not None:
                return self.date[:np.searchsorted(self.date, key.stop, side='left', sorter=None)]
            else:
                return self.date[:]

        i = np.searchsorted(self.date, key, side='left', sorter=None)
        if key != self.date[i]:
            raise KeyError('key: {} was not found!'.format(key))
        else:
            return self.date[i]



aapl = Stock('aapl', ['2010','2012', '2014', '2016', '2018'])

print(aapl['2011':])
print(aapl['2014':'2017'])
print(aapl[:'2016'])
print(aapl['2010'])
print(aapl['2013'])

'''
['2012' '2014' '2016' '2018']
['2014' '2016']
['2010' '2012' '2014']
2010
Traceback (most recent call last):
  File "C:\Users\...\Desktop\...\stock.py", line ##, in <module>
    print(aapl['2013'])
  File "C:\Users\...\Desktop\...\stock.py", line ##, in __getitem__
    raise KeyError('key: {} was not found!'.format(key))
KeyError: 'key: 2013 was not found!'
'''
...