Форматировать / анализировать различные форматы даты правильно - PullRequest
0 голосов
/ 30 мая 2019

получаю Date в 3 форматах из разных APIs

  1. UTC формат: 2014-01-01T00:00:00.000Z (String)
  2. GMT формат: Thu, 29 Nov 2018 17:30:56 GMT (String)
  3. unixTimeStamp: 1558606726 (number)

Также формат UTC иногда может не иметь Z в конце, поэтому обычный синтаксический анализ даст разницу во времени.

function formatDate(dateString) {
  var dateTime, utcFormatRegex, zeroHourOffsetRegex;

// Some APIs return a Date in standard ISO UTC format may not have Z at the end
  utcFormatRegex = /^\d{4}-\d{2}-\d{2}T.*$/;
  zeroHourOffsetRegex = /^.*Z$/;

  if (utcFormatRegex.test(dateString) && !zeroHourOffsetRegex.test(dateString)) {
    dateString+='Z';
  }

    dateTime = new Date(dateString);

}

Учитывая, что есть функции синтаксического анализа для всех различных форматов, мне нужна функция, которая определяет, какую функцию синтаксического анализа мы должны использовать, основываясь на regex и parse соответственно. Если регулярное выражение не идеальное решение, то как я могу подойти к этому?

То, к чему я стремлюсь, - это, вероятно, более надежное решение, чем «если нет Z, тогда добавьте единицу», чтобы получить его для анализа через один анализатор времени и даты. Что если мы получим другой формат даты и времени, который не будет хорошо играть с Z на конце? В этот момент мы сделаем несколько изменений.

1 Ответ

1 голос
/ 31 мая 2019

Использование регулярного выражения - это нормально, но вам нужно строго проверять форматы, которые вы ожидаете.Если вы получаете что-то, чего не ожидаете, выведите ошибку.Один из недостатков текущих встроенных синтаксических анализаторов заключается в том, что невозможно указать строгий синтаксический анализ, например, когда предоставляется формат, и синтаксический анализатор выдает ошибку, если строка ввода не совпадает.

библиотек, которые могут помочь, поиск покажет довольно много.

Но если вам нужно только поддерживать 3 формата в OP, может подойти что-то вроде следующего:

/* Return a Date where the input may be:
**   string: ISO 8601 timestamp that should be treated as UTC
**           whether it has a trailing Z or not
**   string: Timestamp in the format (using moment.js tokens): 
**           ddd, DD MMM YYYY HH:mm:ss GMT 
**   nunber: UNIX time value, seconds since 1970-01-01 UTC
*/
function toDate(value) {
  // Parse the string & fail early if it fails
  let d = new Date(value);
  
  // Throw error if couldn't parse value
  if (isNaN(d.getTime())) {
    throw 'Invalid timestamp: ' + value;
  }
  
  // Otherwise, do the work
  let days = 'Sun Mon Tue Wed Thu Fri Sat'.split(' ');
  let months = 'Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec'.split(' ');

  // Test for time value first as that's the easiest
  if (typeof value == 'number' && !isNaN(value)) {
    return new Date(value * 1000);
    
  // Test for ISO 8601 next
  } else if (/^\d{4}-\d\d-\d\dT\d\d:\d\d:\d\d\.\d\d\dZ?$/.test(value)) {
    return new Date(/Z$/.test(value)? value : value + 'Z');
    
  // Test for random format
  } else if (/^[a-z]{3}, \d?\d [a-z]{3} \d{4} \d\d:\d\d:\d\d GMT$/i.test(value)) {
    let b = value.split(/ |:/);

    if (days.includes(b[0].substr(0,3)) && months.includes(b[2])) {
      let x = new Date(Date.UTC(
                b[3],                 // year
                months.indexOf(b[2]), // month, zero indexed
                b[1],                 // day
                b[4], b[5], b[6]      // hh:mm:ss
              ));
      // Check value was a valid date, only need to check some parts
      if (x.getUTCFullYear() == b[3] &&
          x.getUTCDate() == b[1] &&
          x.getUTCHours() == b[4] &&
          x.getUTCSeconds() == b[6]) {
        return x;
      } else {
        throw 'Invalid timestamp: ' + value;
      }
    }

  // Throw error as must be unknown format
  } else {      
    throw 'Unknown format: ' + value;
  }
}

// Minimal testing 
var isoString0 = '2014-01-01T00:00:00.000Z',
    isoString1 = '2014-01-01T00:00:00.000',         // no Z, parse as UTC anyway
    randomString = 'Thu, 29 Nov 2018 17:30:56 GMT',
    unixTimeValue = 1558606726,                     // Assume seconds
    invalidDate0 = '2018-02-29T00:00:00.000Z',      // no 29 Feb in 2018, fail built-in parse
    invalidDate1 = 'Thu, 29 Feb 2018 17:30:56 GMT', // no 29 Feb in 2018, fail manual parse
    invalidFormat = '6/6/2019';                     // Unknown format

[isoString0, isoString1, randomString, unixTimeValue, invalidDate0,
 invalidDate1, invalidFormat].forEach(s => {
  var result;
  try {
    result = toDate(s);
    console.log(s + ' =>\n' + result.toISOString());
  } catch (e) {
    console.log(e);
  }
});
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...