Я хочу составить таблицу из транзакций из (https://www.basketball -reference.com / leagues / NBA_2017_transactions.html ), но только с даты начала (которая происходит здесь 2 июля 2016 г.) до 31 октября 2016 года.
Таблица представляет собой таблицу с двумя переменными, содержащую имя игрока в формате Name \ refcode и двоичный код того, подписал ли игрок многолетний контракт или нет.Транзакций больше, чем подписей контрактов, таких как сделки, но я не хочу, чтобы они были во фрейме данных.
Таблица, которую я хочу создать, выглядит следующим образом:
Player Multi_Year.Contract
Ben Simmons\simmobe1 1
Timothe Luwawu-Cabarrot\luwawti01 1
I 'Я пытался использовать rvest, xpathSapply и scrapeR, но с моим очень ограниченным пониманием я не могу заставить его отформатировать таким образом.Используя rvest, я мог бы получить все предложения, но это все.К элементу 'p' прикреплено слишком много вещей, и он собирает всю страницу, а не от указанной даты к другой.Я смотрел на регулярные выражения и подобные вещи, но они кажутся слишком продвинутыми для новичка.Есть ли простой способ сделать это?Я думаю, самое главное, это вообще возможно сделать в R?У меня открыто почти 30 вкладок, посвященных попыткам выяснить это, и это сводит меня с ума, я немного новичок в R и заранее благодарен за помощь.
Вот пример HTML-кодачто все происходит в строке 432:
<li><span>July 2, 2016</span><p>The <a data-attr-to="PHI" href="/teams/PHI/2017.html">Philadelphia 76ers</a> signed <a href="/players/s/simmobe01.html">Ben Simmons</a> to a multi-year contract.</p><p>The <a data-attr-to="PHI" href="/teams/PHI/2017.html">Philadelphia 76ers</a> signed <a href="/players/l/luwawti01.html">Timothe Luwawu-Cabarrot</a> to a multi-year contract.</p></li><li><span>July 4, 2016</span><p>The <a data-attr-from="SAC" href="/teams/SAC/2017.html">Sacramento Kings</a> waived <a href="/players/b/butleca01.html">Caron Butler</a>.</p><p>The <a data-attr-from="SAC" href="/teams/SAC/2017.html">Sacramento Kings</a> waived <a href="/players/d/dukandu01.html">Duje Dukan</a>.</p></li><li><span>July 7, 2016</span><p>The <a data-attr-from="CHO" href="/teams/CHO/2017.html">Charlotte Hornets</a> traded <a href="/players/r/richama01.html">Malachi Richardson</a> to the <a data-attr-to="SAC" href="/teams/SAC/2017.html">Sacramento Kings</a> for <a href="/players/b/belinma01.html">Marco Belinelli</a>.</p><p>The <a data-attr-from="GSW" href="/teams/GSW/2017.html">Golden State Warriors</a> traded <a href="/players/b/bogutan01.html">Andrew Bogut</a> and a future 2nd round draft pick to the <a data-attr-to="DAL" href="/teams/DAL/2017.html">Dallas Mavericks</a> for a 2019 2nd round draft pick. (DAL has choice between 2019 or 2020) (DAL pick to GSW is top-55 protected)</p>