Установка NLTK / WORDNET на AWS Lambda через CodeBuild - PullRequest
0 голосов
/ 06 ноября 2018

Я пытаюсь заставить NLTK и Wordnet работать над лямбдой через CodeBuild.

Похоже, что он отлично устанавливается в CloudFormation, но я получаю следующую ошибку в Lambda:

START RequestId: c660c446-e1c4-11e8-8047-15f59f1e002c Version: $LATEST
Unable to import module 'index': No module named 'nltk'

END RequestId: c660c446-e1c4-11e8-8047-15f59f1e002c
REPORT RequestId: c660c446-e1c4-11e8-8047-15f59f1e002c  Duration: 2.10 ms   Billed Duration: 100 ms     Memory Size: 128 MB Max Memory Used: 21 MB  

Однако, когда я проверяю, он прекрасно установлен в CodeBuild:

[Container] 2018/11/06 12:45:06 Running command pip install -U nltk
Collecting nltk
 Downloading https://files.pythonhosted.org/packages/50/09/3b1755d528ad9156ee7243d52aa5cd2b809ef053a0f31b53d92853dd653a/nltk-3.3.0.zip (1.4MB)
Requirement already up-to-date: six in /usr/local/lib/python2.7/site-packages (from nltk)
Building wheels for collected packages: nltk
 Running setup.py bdist_wheel for nltk: started
 Running setup.py bdist_wheel for nltk: finished with status 'done'
 Stored in directory: /root/.cache/pip/wheels/d1/ab/40/3bceea46922767e42986aef7606a600538ca80de6062dc266c
Successfully built nltk
Installing collected packages: nltk
Successfully installed nltk-3.3

Вот фактический код Python:

import json
import datetime
import nltk
from nltk.corpus import wordnet as wn

А вот и файл YML:

version: 0.2

phases:
  install:
    commands:

      # Upgrade AWS CLI to the latest version
      - pip install --upgrade awscli

      # Install nltk & WordNet
      - pip install -U nltk
      - python -m nltk.downloader wordnet

  pre_build:
    commands:

      # Discover and run unit tests in the 'tests' directory. For more information, see <https://docs.python.org/3/library/unittest.html#test-discovery>
      # - python -m unittest discover tests

  build:
    commands:

      # Use AWS SAM to package the application by using AWS CloudFormation
      - aws cloudformation package --template template.yml --s3-bucket $S3_BUCKET --output-template template-export.yml

artifacts:
  type: zip
  files:
    - template-export.yml

Есть идеи, почему он отлично устанавливается в CodeBuild, но не может получить доступ к модулю NLTK в Lambda? Для справки код работает в лямбда-выражении, если вы просто удалите NLTK.

У меня такое чувство, что это проблема с файлом YML, но я не уверен, что, учитывая, что NLTK прекрасно работает.

Ответы [ 2 ]

0 голосов
/ 07 ноября 2018

Хорошо, спасибо Лайке за указание в правильном направлении.

Это рабочее развертывание NLTK & Wordnet в Lambda через CodeStar / CodeBuild. Некоторые вещи, которые нужно иметь в виду:

1) Вы не можете использовать source venv/bin/activate, поскольку он не совместим с POSIX. Вместо этого используйте . venv/bin/activate, как показано ниже.

2) Вы должны установить путь для NLTK, как показано в разделе определения каталогов.

buildspec.yml

version: 0.2

phases:
  install:
    commands:

      # Upgrade AWS CLI & PIP to the latest version
      - pip install --upgrade awscli
      - pip install --upgrade pip

      # Define Directories
      - export HOME_DIR=`pwd`
      - export NLTK_DATA=$HOME_DIR/nltk_data

  pre_build:
    commands:
      - cd $HOME_DIR

      # Create VirtualEnv to package for lambda
      - virtualenv venv
      - . venv/bin/activate

      # Install Supporting Libraries
      - pip install -U requests

      # Install WordNet
      - pip install -U nltk
      - python -m nltk.downloader -d $NLTK_DATA wordnet

      # Output Requirements
      - pip freeze > requirements.txt

      # Unit Tests
      # - python -m unittest discover tests

  build:
    commands:
      - cd $HOME_DIR
      - mv $VIRTUAL_ENV/lib/python3.6/site-packages/* .

      # Use AWS SAM to package the application by using AWS CloudFormation
      - aws cloudformation package --template template.yml --s3-bucket $S3_BUCKET --output-template template-export.yml

artifacts:
  type: zip
  files:
    - template-export.yml

Если у кого-то есть улучшения ЛКМ. Это работает для меня.

0 голосов
/ 06 ноября 2018

NLTK был установлен только локально, на машине, где выполнялось задание CodeBuild. Вам необходимо скопировать NLTK в пакет развертывания CloudFormation. Ваш buildspec.yml будет выглядеть примерно так:

install:
  commands:

  # Upgrade AWS CLI to the latest version
  - pip install --upgrade awscli

pre_build:
  commands:
  - virtualenv /venv

  # Install nltk & WordNet
  - pip install -U nltk
  - python -m nltk.downloader wordnet

build:
  commands:
  - cp -r /venv/lib/python3.6/site-packages/. ./

  # Use AWS SAM to package the application by using AWS CloudFormation
  - aws cloudformation package --template template.yml --s3-bucket $S3_BUCKET --output-template template-export.yml

Дополнительное чтение:

...