В обычном случае, который вы используете, похоже, что ваша индексная серия на самом деле намного меньше, чем исходный фрейм данных, к которому вы хотите применить его. В этом случае имеет смысл материализовать его и использовать простую индексацию, например:
df = pd.DataFrame({'ngram': np.random.choice([1, 2, 3], size=1000),
'other': np.random.randn(1000)}) # fake data
d = dd.from_pandas(df, npartitions=3)
sizes = d.groupby('ngram').size().compute()
d = d.set_index('ngram') # also sorts the divisions
ngrams = sizes[sizes > 300].index.tolist() # a list of good ngrams
d.loc[ngrams].compute()