Я работаю над Apache Spark над проектом Java Maven. У меня есть комментарии подобного рода на этом рисунке;
+--------+--------------+----------------------+-----------------+--------------------+----------------+-----------+-------------+-----+------+------+-------+--------+----------+----------+------------+-----+------------+----------+------------+---+
|archived| author|author_flair_css_class|author_flair_text| body|controversiality|created_utc|distinguished|downs|edited|gilded| id| link_id| name| parent_id|retrieved_on|score|score_hidden| subreddit|subreddit_id|ups|
+--------+--------------+----------------------+-----------------+--------------------+----------------+-----------+-------------+-----+------+------+-------+--------+----------+----------+------------+-----+------------+----------+------------+---+
| true| bostich| null| null| test| 0| 1192450635| null| 0| false| 0|c0299an|t3_5yba3|t1_c0299an| t3_5yba3| 1427426409| 1| false|reddit.com| t5_6| 1|
| true|igiveyoumylife| null| null|much smoother.
...| 0| 1192450639| null| 0| false| 0|c0299ao|t3_5yba3|t1_c0299ao| t3_5yba3| 1427426409| 2| false|reddit.com| t5_6| 2|
| true| Arve| null| null|Can we please dep...| 0| 1192450643| null| 0| false| 0|c0299ap|t3_5yba3|t1_c0299ap|t1_c02999p| 1427426409| 0| false|reddit.com| t5_6| 0|
| true| [deleted]| null| null| [deleted]| 0| 1192450646| null| 0| false| 0|c0299aq|t3_5yba3|t1_c0299aq| t3_5yba3| 1427426409| 1| false|reddit.com| t5_6| 1|
| true| gigaquack| null| null|Oh, I see. Fancy ...| 0| 1192450646| null| 0| false| 0|c0299ar|t3_5yba3|t1_c0299ar|t1_c0299ah| 1427426409| 3| false|reddit.com| t5_6| 3|
| true| Percept| null| null| testing ...| 0| 1192450656| null| 0| false| 0|c0299as|t3_5yba3|t1_c0299as| t3_5yba3| 1427426409| 1| false|reddit.com| t5_6| 1|
Я анализирую данные и показываю только столбец тела. Я хочу очистить (фильтр) [удалено] комментарии и нелатинские комментарии в колонке тела.Как я могу это сделать?(Примечание: размер данных = 32 ГБ)
body:[Deleted]
body:How can I do that?