Этот код анализирует содержимое двух сайтов, отбирая у них все атрибуты href
. Затем он находит те, которые имеют наибольшее совпадение значения href из каждого массива, и сохраняет их в файл CSV. Проблема в том, что когда я открываю файл, он возвращает также данные HTML моего приложения.
В качестве упражнения я могу использовать только HTML и PHP
<form action="<?php echo htmlspecialchars($_SERVER["PHP_SELF"]);?>" method="post">
<input type="text" name="website1">
<input type="text" name="website2">
<input type="submit" name="submit">
if (isset($_POST['submit']))
// form has been submitted
$url1 = $_POST['website1'];
$url2 = $_POST['website2'];
findAndCompare($url1, $url2);
function findAndCompare($url1, $url2)
// Create a DOM parser object
$dom1 = new DOMDocument();
$dom2 = new DOMDocument();
$arr1 = array();
$arr2 = array();
$arr3 = array();
// Iterate over all the <a> tags
foreach($dom1->getElementsByTagName('a') as $link)
// insert the <a href> in arr1
array_push($arr1, $link->getAttribute('href'));
// Iterate over all the <a> tags
foreach($dom2->getElementsByTagName('a') as $link)
// insert the <a href> in arr2
array_push($arr2, $link->getAttribute('href'));
for ($i = 0; $i < count($arr1); $i++)
$max_elem = $arr2[0];
$max = 0;
for ($j = 0; $j < count($arr2); $j++)
similar_text($arr1[$i], $arr2[$j], $perc);
if ($perc > $max)
$max = $perc;
$max_elem = $arr2[$j];
$tmp = array($arr1[$i],$max_elem,$max);
function convert_to_csv($input_array, $output_file_name, $delimiter)
$temp_memory = fopen('php://memory', 'w');
// loop through the array
foreach($input_array as $line)
// use the default csv handler
fputcsv($temp_memory, $line, $delimiter);
fseek($temp_memory, 0);
// modify the header to be CSV format
header('Content-Type: application/csv');
header('Content-Disposition: attachement; filename="' . $output_file_name . '";');
// output the file to be downloaded
convert_to_csv($arr3, 'export.csv', ',');
я решаю это поставив ob_clean();
до header