Было бы полезно подобрать Ruby для моего нового концерта, поэтому сегодня утром я написал следующее. Он берет файл PGN шахматных игр, в которые я играл, и индексирует их первым ходом. Буду признателен за любые предложения о том, как сделать его более "идиоматическим".

Поскольку он не принимает аргументов командной строки (например, для имени файла) и не является объектно-ориентированным, предложения, приветствуемые в этих строках, безусловно, приветствуются.

Имейте в виду, я создаю индекс всех ходов (а не только первых ходов) из всех игр, потому что я хотел бы в конечном итоге индексировать не только первый ход.

Данные следуют за кодом.

games = []
file = File.new("jemptymethod.pgn", "r")

is_header = false
is_score = false

Game = Struct::new(:header, :score)

while (line = file.gets)
  if !line.chomp.empty?
    if !is_score && !is_header
      game = Game::new('','')
    if /^\[/.match(line)
      is_header = true
      game.header << line
      is_score = true
      game.score << line
    if is_score
      is_score = false
      is_header = false
      games << game

puts "# Games: " + games.length.to_s
moves_index = {}
first_moves = {}

games.each { |gm|
  #the following output should essentially be lossless
  #with the possible exception of beginning or ending newlines
  #puts gm.header + "\n"
  #puts gm.score + "\n"

  score_tokens = gm.score.split(/\s+/);
  game_moves = []

    if i%3 != 0
      move_token = score_tokens[i]
      if !moves_index.has_key?(move_token)
        moves_index[move_token] = moves_index.keys.length
      game_moves << moves_index[move_token]

  first_move = moves_index.index(game_moves[0])

  if !first_moves.has_key?(first_move)
    first_moves[first_move] = 1
    first_moves[first_move] = 1 + first_moves[first_move]

# sorting hashes by value: http://nhw.pl/wp/2007/06/11/sorting-hash-by-values
first_moves.sort{|a,b| -1*(a[1]<=>b[1])}.each{|k,v|
  puts "1. #{k} occurred #{v} times" 

Данные (всего 3 игры, с которыми я работал 25):

[Event "Enough With the Draws Already ;)"]
[Site "http://www.queenalice.com/game.php?id=533406"]
[Date "2009.2.1"]
[Round "-"]
[White "Troy"]
[Black "jemptymethod"]
[Result "1/2-1/2"]
[WhiteElo "1300"]
[BlackElo "2076"]
[ECO "C36"]

1. e4 e5 2. f4 exf4 3. Nf3 Be7 4. Bc4 Nf6 5. Qe2 d5 6. exd5 Nxd5 7. O-O Be6 8.
d4 Nc6 9. Nc3 O-O 10. Nxd5 Bxd5 11. Bxd5 Qxd5 12. Bxf4 Bd6 13. Qd2 Rae8 14. Bxd6
Qxd6 15. Rae1 h6 16. c3 Qd5 17. b3 Qa5 18. h3 a6 19. Rf2 Re7 20. Rxe7 Nxe7 21.
Ne5 Nd5 22. c4 Qxd2 1/2-1/2

[Event "AUTO-MASTER-620"]
[Site "http://www.queenalice.com/game.php?id=545265"]
[Date "2009.2.23"]
[Round "2"]
[White "testouverture"]
[Black "jemptymethod"]
[Result "1/2-1/2"]
[WhiteElo "2240"]
[BlackElo "2179"]
[ECO "A52"]

1. d4 Nf6 2. c4 e5 3. dxe5 Ng4 4. Nf3 Bc5 5. e3 Nc6 6. Be2 O-O 7. O-O Re8 8. b3
Ngxe5 9. Bb2 Nxf3+ 10. Bxf3 Ne5 11. Nc3 a5 12. Ne4 Bf8 13. Bh5 Ra6 14. f4 Ng6
15. Ng5 d5 16. Nxf7 Kxf7 17. f5 Kg8 18. fxg6 hxg6 19. Qd4 Qe7 20. Bf3 dxc4 21.
Qxc4+ Be6 22. Qc3 c6 23. Be2 Raa8 24. Bd3 Bf5 25. Bxf5 gxf5 26. Rf3 Qc5 27. Re1
Qxc3 28. Bxc3 g6 29. g4 Bg7 30. Bxg7 fxg4 31. Rg3 Kxg7 32. Rxg4 Rad8 33. Kf2

[Event "AUTO-MASTER-620"]
[Site "http://www.queenalice.com/game.php?id=545266"]
[Date "2009.2.23"]
[Round "2"]
[White "jemptymethod"]
[Black "testouverture"]
[Result "0-1"]
[WhiteElo "2079"]
[BlackElo "2306"]
[ECO "B22"]

1. e4 c5 2. c3 d5 3. exd5 Qxd5 4. d4 Nc6 5. dxc5 Qxd1+ 6. Kxd1 e5 7. Be3 Nf6 8.
b4 a5 9. b5 Ne7 10. Nf3 Ng4 11. Bc4 Nf5 12. Ke2 Nfxe3 13. fxe3 Bxc5 14. h3 Nxe3
15. Nxe5 f6 0-1

Ответы [ 2 ]

Вот быстрое решение, как бы я это сделал. Здесь можно многое переварить, так что не стесняйтесь задавать вопросы, но чтение документации Ruby Array или Enumerable должно ответить на большинство из них о том, что я сделал, Есть множество хороших уроков по рубиновым классам. Вот хороший способ понять методы доступа, которые я использовал здесь, вместо структуры.

class Game
  attr_accessor :header, :moves
  def initialize
    self.header = []

games = []
game = Game.new
File.open('jemptymethod.pgn').each_line do |line|
  next if line.chomp.empty?
  if game.moves
    games << game
    game = Game.new
  if /^\[/.match(line)
    game.header << line
    moves = line.split(/\d+\.\s*/) # splitting on the move numbers so that we don't have to iterate through to remove them
    moves.shift # getting rid of first empty move since the split on '1. ' created an array element before the '1. '
    game.moves = moves
games << game # add last game since the first part of the file loop doesn't execute again to do it

puts "# Games: " + games.length.to_s

first_moves = games.map {|game| game.moves[0]} # Could easily iterate over the size of the longest game to get other moves (eg second move, etc)
first_moves_count = first_moves.inject(Hash.new(0)) {|h, move| h[move] += 1; h} # Read ruby documentation on inject to see how this works
first_moves_count.each do |move, count|
  puts "1. #{move} occurred #{count} times"
Я не выполнил полный рефакторинг, потому что хочу сохранить достаточно исходного кода в целости, чтобы он не слишком запутывал. Основным изменением является введение класса Game, который обрабатывает синтаксический анализ. Реализация этого класса может быть значительно улучшена, но он работает без слишком большого изменения вашего кода. Также некоторые незначительные моменты:

  • Вместо File.new прочитайте файл, используя File.open, и дайте ему блок, который принимает параметр file. Файл автоматически закрывается в конце блока.

  • Использование a += 1 вместо a = a + 1.

Я составил простую запись и написал парсер для обработки деталей игры в теннис при игре в теннис . Возможно, вы захотите взглянуть на этот код в качестве примера парсинга игровых ходов. На самом деле это очень похоже на то, что вы делаете. Основная часть кода находится в каталоге /lib. Логика синтаксического анализа в parser.rb, а компоненты игры в других файлах. Я бы посоветовал вам разбить ваши шахматные партии таким же образом, добавив класс Move.

В любом случае, вот мой полурефакторинг вашего кода:

class Game
  attr_accessor :header, :score, :moves

  def initialize
    @header = ""
    @score  = ""
    @moves  = []

  def first_move

  def moves_index
    moves_index = {}
    score.split(/\s+/).each_with_index do |move,i|
      if i%3 != 0
        unless moves_index.has_key?(move)
          moves_index[move] = moves_index.keys.length
        moves << moves_index[move]

games     = []
is_header = false
is_score  = false

File.open("jemptymethod.pgn") do |file|
  while (line = file.gets)
    if !line.chomp.empty?
      if !is_score && !is_header
        game = Game.new
      if line[0,1] == '['
        is_header = true
        game.header << line
        is_score = true
        game.score << line
    elsif is_score
      is_score = false
      is_header = false
      games << game

puts "# Games: " + games.length.to_s
first_moves = {}

#the following output should essentially be lossless
#with the possible exception of beginning or ending newlines
#puts gm.header + "\n"
#puts gm.score + "\n"
games.each do |gm|
  if !first_moves.has_key?(gm.first_move)
    first_moves[gm.first_move] = 1
    first_moves[gm.first_move] += 1

# sorting hashes by value: http://nhw.pl/wp/2007/06/11/sorting-hash-by-values
first_moves.sort{|a,b| -1*(a[1]<=>b[1])}.each{|k,v|
  puts "1. #{k} occurred #{v} times" 
