Каков наилучший тип базы данных (ориентированный на документ, реляционный, ключ-значение и т. Д.) Для хранения html-файла (небольших размеров, ~ макс. 700 КБ) в базе данных?
В настоящее время я использую sqlite3 с python, но, похоже, он работает довольно медленно, если количество записей / файлов превышает 3000 (тогда .db-файл составляет около 260 МБ).Кроме того, sqlite не подходит для многопроцессорных сценариев.
Схема sqlite выглядит следующим образом:
CREATE TABLE articles (url TEXT NOT NULL,published DATETIME,title TEXT, fetched TEXT NOT
NULL,section TEXT,PRIMARY KEY (url), FOREIGN KEY(url) references
contents(url));
CREATE TABLE contents(url TEXT NOT NULL,date DATETIME,content TEXT,PRIMARY KEY (url));
CREATE TABLE shares (url TEXT NOT NULL, date DATETIME,likes INTEGER NOT NULL,
totals INTEGER NOT NULL,clicks INTEGER, comments INTEGER NOT
NULL,share INTEGER NOT NULL,
tweets INTEGER NOT NULL,PRIMARY KEY(date,url),FOREIGN KEY (url)
REFERENCES articles(url));
И HTML-файлы переходят на содержимое