В моем сценарии я пытаюсь получить определенный сохраненный текст AWS S3 file
word count
и его language detection
с использованием AWS lambda
кода Python. Здесь, ниже код, который я пытаюсь. Он предоставляет счетчик строк, но я не знаю, как узнать количество слов и определение языка. Пожалуйста, предоставьте некоторую идею для определения количества слов в файле и определения языка.
Я пытался подсчитать количество строк
import boto3
def lambda_handler(event, context):
# create the s3 resource
s3 = boto3.resource('s3')
# get the file object
obj = s3.Object('bucket name', 'sample.txt')
# read the file contents in memory
file_contents = obj.get()["Body"].read()
# print the occurrences of the new line character to get the number of lines
# print file_contents.count('\n')
# TODO implement
return {
'Line Count': file_contents.count('\n')
}
Текущий ответ:
{
«Количество строк»: 48,
}
Ожидаемый ответ:
{
«Количество строк»: 48,
«Количество слов»::?, // Здесь я хочу показать количество слов
«Язык»:? // Здесь название языка
}