привет, у меня есть этот код для разделения аудио в формате mp3, и он работает, когда я даю параметр, как в этом примере:
from pydub import AudioSegment
start_time = '00:00:50' #Format 'hh:mm:ss'
end_time = '00:01:48' #Format 'hh:mm:ss'
filename = 'C://Users//home//Desktop//testPython//audio//test.mp3'
и эта функция:
def splitTimes(time):
splitted_time = time.split(sep = ':')
toSec = (int(splitted_time[0])*3600)+(int(splitted_time[1])*60)+int(splitted_time[2])
toMillisec = toSec * 1000
print(toMillisec)
return toMillisec
я написал этот кодчтобы применить его:
sound = AudioSegment.from_file(filename)
print('Splitting Audio...')
firstpart = sound[splitTimes(start_time):splitTimes(end_time)]
firstpart.export("C://Users//User-7//Desktop//testPython//audio//splitted.mp3", format="mp3")
print('Done...')
и работает правильно. у меня pyspark dataframe содержит:
+--------+--------+--------+
| start| end|FileName|
+--------+--------+--------+
|00:00:11|00:00:23| 2|
|00:00:54|00:01:16| 3|
|00:02:12|00:02:24| 4_m|
|00:02:28|00:02:41| 4_p|
+--------+--------+--------+
мой вопрос: как применить эту функцию ко всем строкам этого dataframe
start_time = start
end_time = end
splitted = filename (name of splitted file)