Состояние гонки в запросах на секвестирование нескольких таблиц - PullRequest
5 голосов
/ 08 июля 2019

Проблема:

Я работаю над проектом, который состоит из нескольких исследований и группы пользователей, каждый из которых участвует в одном из исследований.Каждое исследование делит участников на две группы на основе списка, который генерируется с использованием некоторого алгоритма рандомизации.После регистрации каждый пользователь назначается для исследования, и его группа определяется порядком регистрации и соответствующим индексом в списке групп.Например, если исследование A имеет общее количество мест 4, а список групп - [0, 1, 1, 0], то первый пользователь назначается группе 0, второй - 1 и т. Д., Пока исследование не будет заполнено.

В проекте определены другие роли пользователей, которые являются администраторами и могут быть назначены для нескольких исследований, не занимая какую-либо должность в исследовании.Это означает, что отношение пользователей к исследованиям составляет n:m.

Проблема, которая возникает в текущей реализации, - это состояние гонки при назначении пользователей для исследований и учебных групп.Код приведен ниже, и способ его работы заключается в том, что он переопределяет модель addUser из Study и всякий раз, когда пользователь добавляется в исследование, он проверяет, сколько пользователей уже участвует в исследовании, и дает пользователю текущий индекссписок групп, который является номером seatsTaken.Это работает до тех пор, пока пользователи добавляются в исследование с интервалами.Но всякий раз, когда несколько пользователей добавляются одновременно, асинхронные запросы вызывают состояние гонки, и на число seatsTaken влияют другие пользователи, регистрирующиеся одновременно.

В приведенном ниже примере назначенные пользователиДля изучения A через определенные промежутки времени назначаются правильные группы, а для изучения B с одновременными запросами назначается неправильное распределение групп.

const Sequelize = require('sequelize');
const assert = require('assert');

const sequelize = new Sequelize({
  database: 'database',
  username: 'username',
  password: 'password',
  dialect: process.env.DB_DIALECT || 'sqlite',
  storage: 'db.sqlite',
  logging: false
});

const User = sequelize.define('user', {
  id: {
    type: Sequelize.INTEGER,
    autoIncrement: true,
    primaryKey: true,
  },
  group: {
    type: Sequelize.INTEGER,
    allowNull: true,
    defaultValue: null
  }
});

// Groups list for studies 'A' and 'B'
const groupLists = {
  a: [0, 1, 1, 0],
  b: [1, 0, 1, 0]
}

const Study = sequelize.define('study', {
  id: {
    type: Sequelize.INTEGER,
    autoIncrement: true,
    primaryKey: true,
  },
  name: {
    type: Sequelize.STRING,
    allowNull: false
  },
  seatsTotal: {
    type: Sequelize.INTEGER,
    defaultValue: 0
  }
});

// n:m relation between users and studies
User.belongsToMany(Study, {through: 'UserStudy'});
Study.belongsToMany(User, {through: 'UserStudy'});

// Overridden 'addUser' method for groups assignment
Study.prototype.addUser = async function(user) {
  // Count already occupied seats
  const seatsTaken = await User.count({
    include: [{
      model: Study,
      where: {
        name: this.name
      }
    }]
  });
  // Add the user to study
  await Study.associations.users.add(this, user);
  // Assign the group of the user based on the seatsTaken
  await user.update({ group: groupLists[this.name][seatsTaken] });
}

sequelize.sync({force: true}).then(async () => {
  // Studies 'A' and 'B' with 4 seats
  await Study.bulkCreate([{name: 'a', seatsTotal: 4}, {name: 'b', seatsTotal: 4}]);
  // 8 users
  await User.bulkCreate(new Array(8).fill(0).map(() => ({})));

  const studies = await Study.findAll();
  const users = await User.findAll(); 

  // Assign half of the users to study 'A' in intervals
  users.filter((_, idx) => idx % 2 === 0).forEach((user, idx) => {
    setTimeout(() => {
      studies[0].addUser(user);
    }, 100*idx);
  });

  // Assign the other half to study 'B' at the same time
  await Promise.all(users.filter((_, idx) => idx % 2 === 1).map(user => {
    return studies[1].addUser(user);
  }));

  setTimeout(async () => {
    // Wait for all queries to finish and assert the results
    const userStudies = await User.findAll({
      include: [Study]
    });

    const studyUsersA = userStudies.filter(u => u.studies.some(s => s.name === 'a'));
    const studyUsersB = userStudies.filter(u => u.studies.some(s => s.name === 'b'));

    try {
      console.log('Group list A actual:', studyUsersA.map(u => u.group), 'expected:', groupLists['a']);
      assert.deepEqual(studyUsersA.map(u => u.group).sort((a, b) => a-b), groupLists['a'].sort((a, b) => a-b), 'Group list A is not assigned correctly');
      console.log('Group list B actual:', studyUsersB.map(u => u.group), 'expected:', groupLists['b']);
      assert.deepEqual(studyUsersB.map(u => u.group).sort((a, b) => a-b), groupLists['b'].sort((a, b) => a-b), 'Group list B is not assigned correctly');
      console.log(`Passed: Group lists are assigned correctly.`);
    } catch (e) {
      console.log(`Failed: ${e.message}`);
    }
  }, 500);
});

Смежные вопросы, которые я могу найти, касаются либо увеличения одного значения в одной таблице, либоони просто упоминают транзакции и блокировки, не предоставляя пример кода:
Как избежать состояния гонки с помощью Nodejs Sequelize
Как заблокировать таблицу в sequelize, подождать, пока другой запрос будет выполнен
Оператор присваивания и вычитания с Sequelize
Условия гонки базы данных

Ограничения:

  • Стек проекта - nodejs, expressjs и sequelize с базой данных mysql для производства и sqlite для разработкиlopment и тесты.
  • Решение должно работать как для sqlite, так и для mysql.
  • Желательно, чтобы списки групп не сохранялись в базе данных.Списки генерируются алгоритмом и семенами рандомизации, но в коде примера они жестко закодированы.
  • Решение должно быть решением сиквелиза, а не дросселированием или очередями пользовательских запросов на экспресс-сервере.
  • В случае одновременных запросов строго не требуется, чтобы точный порядок регистрации пользователей сохранялся, поскольку на самом деле невозможно проверить, какой пользователь был добавлен в исследование первым, но конечный результат должен иметь правильное число 0 с и 1 s, которые являются назначенными группами.
  • Я пытался секвестировать транзакции, но у меня было много проблем с совместимостью с sqlite, а также с ошибками экспресс-запросов из-за блокировок базы данных, но это могло быть из-за моего недостатка знанийо том, как сделать это правильно.Здесь ограничение заключается в том, что запросы не должны завершаться сбоем из-за блокировок базы данных.

Приведенный код является минимальным примером, воспроизводящим проблему.Пожалуйста, используйте его в качестве основы.

Для запуска кода

npm install sequelize sqlite3 mysql2

sqlite:

node index.js

mysql (с помощью докера):

docker run -d --env MYSQL_DATABASE=database --env MYSQL_USER=username --env MYSQL_PASSWORD=password --env MYSQL_RANDOM_ROOT_PASSWORD=yes -p 3306:3306 mysql:5.7
DB_DIALECT=mysql node index.js

Примечание:

  • Пример кода предназначен только для демонстрации проблемы в текущей реализации, а интервалы и тайм-ауты служат для имитации взаимодействия пользователей с сервером.Пожалуйста, не сосредотачивайтесь на шаблонах в примере, которые являются неправильными, а скорее сосредоточьтесь на самой проблеме и на том, как к ней можно подойти лучше, отвечая требованиям, указанным в разделе ограничений.
  • Это частьдовольно большой проект, и я мог бы обновить требования на основе фактических требований проекта и отзывов, которые я получаю здесь.

Пожалуйста, дайте мне знать, если я должен предоставить какую-либо другую информацию.Заранее спасибо.

1 Ответ

2 голосов
/ 08 июля 2019

Боюсь, что это ожидаемое поведение.

  • Вы объявляете seatsTaken как асинхронно вычисляемое свойство.
  • Вы также вставляете несколько пользователей асинхронно.
  • Вы не изолируете каждое создание пользователя в его собственной транзакции.

Из-за этого вы видите изменяющееся состояние одной транзакции, и оно меняется довольно хаотично, потому что вы не указываете какой-либо определенный заказ,В конечном итоге состояние становится непротиворечивым, но ваш способ достичь этого состояния - просто подождать некоторое время.

Полагаю, самым простым способом достижения согласованности было бы завершение каждой вставки в транзакцию.

Если транзакция на одну вставку слишком медленная, вы можете массово вставить все записи пользователей в одну транзакцию, а затем подсчитать количество мест, занятых в другой, или даже просто сделать все синхронно.

В любом случае, если вы хотите согласованности,вам нужна логическая сериализация, четкое отношение «до и после».В настоящее время вашему коду этого не хватает, AFAICT.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...