Я могу ошибаться (я читал учебные пособия по карте / сокращению, но еще не использовал их для реальных проектов), но я думаю, что в целом это идентификатор входной записи; например, кортеж (имя файла, номер строки). В данном конкретном случае это предположительно номер строки, и он не представляет интереса для подсчета слов. Это может быть использовано, если идея состоит в том, чтобы, скажем, рассчитывать совокупное количество слов на строку, а не на файл (или для нескольких файлов, если ключ содержал эту информацию).