Как применить мою функцию ко всем строкам фрейма данных pyspark - PullRequest
0 голосов
/ 26 октября 2019

привет, у меня есть этот код для разделения аудио в формате mp3, и он работает, когда я даю параметр, как в этом примере:

from pydub import AudioSegment

start_time = '00:00:50' #Format 'hh:mm:ss'
end_time = '00:01:48'   #Format 'hh:mm:ss'
filename = 'C://Users//home//Desktop//testPython//audio//test.mp3'

и эта функция:

def splitTimes(time):
    splitted_time = time.split(sep = ':')
    toSec = (int(splitted_time[0])*3600)+(int(splitted_time[1])*60)+int(splitted_time[2])
    toMillisec = toSec * 1000
    print(toMillisec)
    return toMillisec

я написал этот кодчтобы применить его:

sound = AudioSegment.from_file(filename)

print('Splitting Audio...')
firstpart = sound[splitTimes(start_time):splitTimes(end_time)]
firstpart.export("C://Users//User-7//Desktop//testPython//audio//splitted.mp3", format="mp3")
print('Done...')

и работает правильно. у меня pyspark dataframe содержит:

+--------+--------+--------+
|   start|     end|FileName|
+--------+--------+--------+
|00:00:11|00:00:23|       2|
|00:00:54|00:01:16|       3|
|00:02:12|00:02:24|     4_m|
|00:02:28|00:02:41|     4_p|
+--------+--------+--------+

мой вопрос: как применить эту функцию ко всем строкам этого dataframe

start_time = start 
end_time = end
splitted = filename (name of splitted file)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...