Вы можете загрузить большой файл в Pandas DataFrame (скажем, df ), используя метод pd.from_csv()
. После этого вы можете разделить информационный кадр на Train ( df_train ) и Test.( df_val )
Теперь вы можете использовать pd.to_csv()
два раза и передавать имена файлов в качестве параметра функции для создания текстовых файлов movie_dialog_train.txt и movie_dialog_val.txt
Вы можете создать небольшой скрипт Python только для этого и запустить его так, чтобы ваши файлы поездов и валидации присутствовали до того, как вы фактически запустите код.