Я не думаю, что вы можете прочитать данные .Z
с помощью любого модуля в Python; вы можете просмотреть Pypi и посмотреть, есть ли модуль для расширения .Z
. Однако вы можете использовать командную строку для обработки данных.
import subprocess
from io import StringIO
data = subprocess.run(
"""curl https://archive.ics.uci.edu/ml/machine-learning-databases/diabetes/diabetes-data.tar.Z |
tar -xOvf diabetes-data.tar.Z --wildcards 'Diabetes-Data/data-*' """,
shell=True,
capture_output=True,
text=True,
).stdout
df = pd.read_csv(StringIO(data), sep="\t", header=None)
df.head()
0 1 2 3
0 04-21-1991 9:09 58 100
1 04-21-1991 9:09 33 009
2 04-21-1991 9:09 34 013
3 04-21-1991 17:08 62 119
4 04-21-1991 17:08 33 007
Вы можете прочитать эту электронную книгу , чтобы узнать больше о параметрах командной строки.