Читать ID3 теги удаленного MP3-файла в Ruby / Rails? - PullRequest
4 голосов
/ 05 октября 2011

Используя Ruby, как можно проанализировать теги ID3 удаленных mp3-файлов без загрузки всего файла на диск?

Этот вопрос задавался в Java и Silverlight , но без рубина.

Редактировать: Глядя на ответ Java, кажется, что возможно (HTTP поддерживает это) загрузить только конец файла, в котором находятся теги.Можно ли это сделать в Ruby?

Ответы [ 2 ]

4 голосов
/ 06 октября 2011

какую версию Ruby вы используете?

какую версию тега ID3 вы пытаетесь прочитать?

теги ID3v1 находятся в конце файла, в последних 128 байтах.С Net :: HTTP, кажется, невозможно искать вперед к концу файла и читать только последние N байтов.Если вы попробуете это, используя headers = {"Range" => "bytes=128-"}, то, кажется, всегда загружается полный файл.resp.body.size => file-size.Но не большая потеря, потому что ID3 версии 1 на данный момент сильно устарела из-за его ограничений, таких как формат фиксированной длины, только текст ASCII, ...).iTunes использует ID3 версии 2.2.0.

теги ID3v2 находятся в начале файла - для поддержки потоковой передачи - вы можете скачать начальную часть файла MP3, которая содержит заголовок ID3v2по протоколу HTTP> = 1.1

Краткий ответ:

require 'net/http'
require 'uri'
require 'id3'    # id3 RUby library
require 'hexdump'


file_url = 'http://example.com/filename.mp3'
uri = URI(file_url)

size = 1000   # ID3v2 tags can be considerably larger, because of embedded album pictures

Net::HTTP.version_1_2  # make sure we use higher HTTP protocol version than 1.0
http = Net::HTTP.new(uri.host, uri.port)

resp = http.get( file_url , {'Range' => "bytes=0-#{size}"} )
# should check the response status codes here.. 

if resp.body =~ /^ID3/   # we most likely only read a small portion of the ID3v2 tag..
   # file has ID3v2 tag

   puts resp.body.hexdump

   tag2 = ID3::Tag2.new
   tag2.read_from_buffer( resp.body )
   @id3_tag_size = tag2.ID3v2tag_size   # that's the size of the whole ID3v2 tag
                                        # we should now re-fetch the tag with the correct / known size
   # ...
end

Например:

 index       0 1 2 3  4 5 6 7  8 9 A B  C D E F

00000000    ["49443302"] ["00000000"] ["11015454"] ["3200000d"]    ID3.......TT2...
00000010    ["004b6167"] ["75796120"] ["48696d65"] ["00545031"]    .Kaguya Hime.TP1
00000020    ["00000e00"] ["4a756e6f"] ["20726561"] ["63746f72"]    ....Juno reactor
00000030    ["0054414c"] ["00001100"] ["4269626c"] ["65206f66"]    .TAL....Bible of
00000040    ["20447265"] ["616d7300"] ["54524b00"] ["00050036"]     Dreams.TRK....6
00000050    ["2f390054"] ["59450000"] ["06003139"] ["39370054"]    /9.TYE....1997.T
00000060    ["434f0000"] ["1300456c"] ["65637472"] ["6f6e6963"]    CO....Electronic
00000070    ["612f4461"] ["6e636500"] ["54454e00"] ["000d0069"]    a/Dance.TEN....i
00000080    ["54756e65"] ["73207632"] ["2e300043"] ["4f4d0000"]    Tunes v2.0.COM..
00000090    ["3e00656e"] ["67695475"] ["6e65735f"] ["43444442"]    >.engiTunes_CDDB
000000a0    ["5f494473"] ["00392b36"] ["34374334"] ["36373436"]    _IDs.9+647C46746
000000b0    ["38413234"] ["38313733"] ["41344132"] ["30334544"]    8A248173A4A203ED
000000c0    ["32323034"] ["4341422b"] ["31363333"] ["39390000"]    2204CAB+163399..
000000d0    ["00000000"] ["00000000"] ["00000000"] ["00000000"]    ................

Длинный ответ выглядитпримерно так: (вам понадобится библиотека id3 версии 1.0.0_pre или новее)

require 'net/http'
require 'uri'
require 'id3'    # id3 RUby library                                                                                      
require 'hexdump'

file_url = 'http://example.com/filename.mp3'

def get_remote_id3v2_tag( file_url )    # you would call this..
  id3v2tag_size = get_remote_id3v2_tag_size( file_url )
  if id3v2tag_size > 0
    buffer = get_remote_bytes(file_url, id3v2tag_size )
    tag2 = ID3::Tag2.new
    tag2.read_from_buffer( buffer )
    return tag2
  else
    return nil
  end
end

private
def get_remote_id3v2_tag_size( file_url )
  buffer = get_remote_bytes( file_url, 100 )
  if buffer.bytesize > 0
    return buffer.ID3v2tag_size
  else
    return 0
  end
end

private
def get_remote_bytes( file_url, n)
  uri = URI(file_url)
  size = n   # ID3v2 tags can be considerably larger, because of embedded album pictures                                 
  Net::HTTP.version_1_2  # make sure we use higher HTTP protocol version than 1.0                                        
  http = Net::HTTP.new(uri.host, uri.port)
  resp = http.get( file_url , {'Range' => "bytes=0-#{size-1}"} )                                                                     
  resp_code = resp.code.to_i
  if (resp_code >= 200 && resp_code < 300) then
    return resp.body
  else
    return ''
  end
end



get_remote_id3v2_tag_size( file_url )  
 => 2262

См .:

http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.35

http://en.wikipedia.org/wiki/Byte_serving

некоторые примеры загрузки файлов по частям можно найти здесь:

, но, пожалуйста, обратите внимание, что, похоже, нет способа начать загрузку "в середине"

Как загрузить двоичный файл по HTTP?

http://unixgods.org/~tilo/Ruby/ID3/docs/index.html

2 голосов
/ 05 октября 2011

вам, по крайней мере, придется загрузить последние блоки файла, которые содержат теги ID3 - см. Определения тегов ID3 ​​...

если у вас есть доступ к файлам в удаленной файловой системе, вы можете это сделать. это удаленно, а затем передать обратно ID3 теги

Edit:

Я думал о тегах ID3 v1 - теги версии 2 находятся впереди.

...