Чтение данных из файла Word (.docx) или HTM и загрузка в базу данных mysql с использованием PHP - PullRequest
0 голосов
/ 28 февраля 2019

Я создаю базу ответов на вопросы с несколькими вариантами ответов, где также есть изображения и вопросы.Q & A в текстовом документе.Поэтому я пытаюсь прочитать данные и загрузить их в базу данных.

Что я сделал до сих пор: Я преобразовал файл слова в файл HTM, поэтому изображения теперь сохраняются впапка и файл HTM имеют путь и имя файла к этому.Мой HTM-файл выглядит примерно так (это один вопрос с опцией и другой информацией):

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>I.16) </span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>Q.16) </span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'><img width=419
height=288 id="Picture 2" src="20180808_files/image001.jpg"></span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>*[1] 13</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[2] 17</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[3] 84</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[4] 98</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[MARKS] 2</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[NEGATIVE MARKS] 0.5</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[TAG] General
Intelligence and Reasoning</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[DIFFICULTY] Easy</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[ANSWER TIME] 0</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[QUESTION TYPE]
Multi_choice</span></p>

<p class=MsoNormal style='line-height:137%;background:white'><span
style='font-size:12.0pt;line-height:137%;color:windowtext'>[SOLUTION]</span></p>

Теперь вот мой php-код:

<?php
    if(isset($_POST["Upload"]))
    {
        $filename=$_FILES["file"]["tmp_name"];
        if($_FILES["file"]["size"] > 0)
        {
        $file = fopen($filename, "r");
             while (($htmData = fgets($file, 10000)) !== FALSE)
             {
              print_r($htmData);
             }
         fclose($file);
    }
    else
        echo 'Invalid File';
}
?>

Я получаю чистый документ какэто в print_r, но теперь мне нужно получить только вопрос и ответы в массиве, чтобы я мог вставить в БД.но не уверен, как избавиться от [CAPITAIZED INFOS] и других.

I.16)

Q.16)
/img path


*[1] 13

[2] 17

[3] 84

[4] 98

[MARKS] 2

[NEGATIVE MARKS] 0.5

[TAG] General Intelligence and Reasoning

[DIFFICULTY] Easy

[ANSWER TIME] 0

[QUESTION TYPE] Multi_choice

[SOLUTION]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...