У меня есть опубликованные в формате HTML версии Jupyter Notebooks, которые мне нужно конвертировать обратно в исполняемые файлы Jupyter.ipynb. Я нашел много обсуждений и подходов к тому, как пойти другим путем, опубликовать файл Jupyter.ipynb в файл HTML. В каждом веб-клиенте Jupyter NB в меню «Файл ...» есть функция публикации в HTML или «Скачать как ...» с HTML в качестве одного из многих параметров. Однако функции «Импорт в Jupyter» или «Импорт из HTML» отсутствуют. Я что-то упустил в этом сценарии? Это не так уж редко.
Если не считать написания моего собственного веб-мастера для очистки опубликованной на HTML версии Jupyter NB, а затем программного создания структуры JSON NB в формате файла IPython NB, есть ли более простой способ сделать это?
Я попробовал следующий код из записной книжки IPython: преобразовать записную книжку HTML в ipynb с приличными результатами, но это только захватывает и преобразовывает ячейки кода и ячейку уценки.
from bs4 import BeautifulSoup
import json
import urllib.request
url = 'http://nbviewer.jupyter.org/url/jakevdp.github.com/downloads/notebooks/XKCD_plots.ipynb'
response = urllib.request.urlopen(url)
# for local html file
# response = open("/Users/note/jupyter/notebook.html")
text = response.read()
soup = BeautifulSoup(text, 'lxml')
# see some of the html
print(soup.div)
dictionary = {'nbformat': 4, 'nbformat_minor': 1, 'cells': [], 'metadata': {}}
for d in soup.findAll("div"):
if 'class' in d.attrs.keys():
for clas in d.attrs["class"]:
if clas in ["text_cell_render", "input_area"]:
# code cell
if clas == "input_area":
cell = {}
cell['metadata'] = {}
cell['outputs'] = []
cell['source'] = [d.get_text()]
cell['execution_count'] = None
cell['cell_type'] = 'code'
dictionary['cells'].append(cell)
else:
cell = {}
cell['metadata'] = {}
cell['source'] = [d.decode_contents()]
cell['cell_type'] = 'markdown'
dictionary['cells'].append(cell)
open('notebook.ipynb', 'w').write(json.dumps(dictionary))
Он не конвертирует весь ноутбук и не работает в пакетном режиме.