Я пытаюсь разобрать простой текстовый документ в PHP, но не знаю, как это сделать правильно.Я хочу отделить каждое слово, назначить им идентификатор и сохранить результат в формате JSON.
Пример текста:
"Hello, how are you (today)"
Это то, что я сейчас делаю:
$document_array = explode(' ', $document_text);
json_encode($document_array);
Результирующий JSON:
[["Hello,"],["how"],["are"],["you"],["(today)"]]
Как мне обеспечить, чтобы пробелы оставались на месте и чтобы символы не включались вместе со словами ...
[["Hello"],[", "],["how"],[" "],["are"],[" "],["you"],[" ("],["today"],[")"]]
Я уверен, что требуется какое-то регулярное выражение ... но я понятия не имею, какой тип шаблона применить, чтобы иметь дело со всеми делами ... Любые предложения, ребята?