Тело Json усекается с использованием неанглийских символов в лямбда-функции AWS - PullRequest
0 голосов
/ 13 октября 2018

Я использую шлюз API и функцию AWS Lamdba в качестве прокси для API моей компании (C # Web API 2.0). Функция Lambda написана на Python 2.7, и я использую urllib2 из Pyhton для передачи http-запроса в API.

Я столкнулся со странной проблемой, когда отправляю тело json, содержащее ивритские символы.Json режется посередине.Я проверяю, что Json, отправленный с Lambda, завершен, но тело JSON, полученное в Lambda, где-то по пути извлекается.

Это функция Lambda:

from __future__ import print_function

import json
import urllib2
import HTMLParser


base = "http://xxxxxx/api"

hparser = HTMLParser.HTMLParser()

def lambda_handler(event, context):
    print("Got event\n" + json.dumps(event, indent=2))

    # Form URL
    url = base + event['queryStringParameters']['rmt']
    print('URL = %s' % url)
    req = urllib2.Request(url)
    if 'body' in event:
        if event['body']:
            print('BODY = %s' %  json.dumps(event['body'], ensure_ascii=False, encoding='utf8') )
            req.add_data(json.dumps(event['body'], ensure_ascii=False, encoding='utf8'))


    # Copy only some headers
    if 'headers' in event:
        if event['headers']:
            copy_headers = ('Accept', 'Content-Type', 'content-type')
            for h in copy_headers:
                if h in event['headers']:
                    print('header added = %s' % event['headers'][h])
                    req.add_header(h, event['headers'][h])


    # Build response
    out = {}
    headersjsonstr = ('Access-Control-Allow-Origin', '')
    response_header = {}

    try:
        print('Trying here...')
        resp = urllib2.urlopen(req)
        out['statusCode'] = resp.getcode()
        out['body'] = resp.read()
        for head in resp.info().headers:

            keyval = head.split(':')
            if any(keyval[0] in h  for h in headersjsonstr): 
                response_header[keyval[0]] = keyval[1].replace('\r','').replace('\n','').strip()

        print('response_header = %s' % response_header )
        out['headers'] = response_header
        print('status = %s' % out['statusCode'] )

    except urllib2.HTTPError as e:

        out['statusCode'] = e.getcode()
        out['body'] = e.read()
        out['headers'] = e.headers
        print('status = %s' % out['statusCode'] )

    return out

Это необработанное тело сообщения Post Json

{"company":"שלום","guests":[{"fullname":"אבי","carno":"67"}],"fromdate":"2018-10-10","todate":"2018-10-10","fromtime":"07:31","totime":"07:31","comments":null,"Employee":{"UserId":"ink1445"}}

И вот что я получаю по API:

"{\"company\":\"שלום\",\"guests\":[{\"fullname\":\"אבי\",\"carno\":\"67\"}],\"fromdate\":\"2018-10-10\",\"todate\":\"2018-10-10\",\"fromtime\":\"07:31\",\"totime\":\"07:31\",\"comments\":null,\"Employee\":{\"UserId\":\"ink1

Опять же, когда я отправляю только английские письма, все в порядке.

Пожалуйста, помогите!

Спасибо

1 Ответ

0 голосов
/ 13 октября 2018

Скорее всего, ваш JSON-буфер слишком мал, и вы получаете усечение переполнения.

Вероятно, размер был задан в предположении кодировки ASCII или utf-8, а ваши символы Юникода шире (потребляют больше байтов).

В зависимости от того, какой пакет json вы используете, вы можете установить опцию для Unicode или вам может потребоваться настроить размер буфера вручную.

...