Разбор Javascript веб-страницы с использованием Python - PullRequest
0 голосов
/ 20 июня 2019

В настоящее время я строю небольшой Python Scrapper, чтобы собрать списки недвижимости.Часть информации встроена в javascript.Я пытаюсь получить содержание первого появления «idannonce» и «idagence».Можно ли получить информацию, используя BeautifulSoup?Как

Большое спасибо!

Крис

var ava_data = {
    logged: logged,
    lengthcarrousel: 2,
    products : [
        {
            "idannonce" : "147919303",
            "idagence" : "256429",
            "idtiers" : "280208",
            "typedebien" : "Appartement",
            "typedetransaction" : ["vente"],
            "idtypepublicationsourcecouplage" : "SL",
            "position" : "0",
            "codepostal" : "75014",
            "produitsvisibilite" : "AD:AH:AD:AH:AD:AH:AW",
            "affichagetype" :
            [{
                "name": "detail",
                "value": "true"
            }],
            "cp" : "75014",
            "codeinsee" : "750114",
            "ville" : "paris-14eme",
            "etage" : "0",
            "idtypechauffage" : "radiateur",
            "idtypecommerce" : "0",
            "idtypecuisine" : "équipée",
            "naturebien" : "1",
            "si_balcon" : "0",
            "nb_chambres" : "1",
            "nb_pieces" : "2",
            "si_sdbain" : "1",
            "si_sdEau" : "0",
            "nb_photos" : "4",
            "prix" : "383000",

                "mensualiteFinance" : "1 532",

            "surface" : "37",
            "dpeL" : "F",
            "dpeC" : "394"
        }



// 



        ,
        {
            "idannonce" : "148265481",
            "idagence" : "76979",
            "idtiers" : "108380",
            "typedebien" : "Appartement",
            "typedetransaction" : ["viager"],
            "idtypepublicationsourcecouplage" : "SL",
            "position" : "0",
            "codepostal" : "75014",
            "codeinsee" : "750114",
            "produitsvisibilite" : "AD:AC:AD:AC:AD:AC:AW",
            "affichagetype" :
            [{
                "name": "interannonce",
                "value": "true"
            }]
        }

        ,
       ...
...