Почему часть вывода подпроцесса, выполняемого Popen (), потеряна? - PullRequest
0 голосов
/ 30 мая 2011

Это странная проблема.Я начал работать над этим в этом потоке , и теперь он превратился во что-то немного другое.

Я использую Popen () для выполнения Perl-программы anubadok.Программа Perl записывает свой вывод в файл.Вот фрагмент кода Perl, который делает это.4-й.оператор print (после открытия OUTFILE ...) записывает неанглийские символы Юникода (бенгальский).Я добавил 3 строки печати перед ним, чтобы проверить, правильно ли пишутся все символы Юникода.

...
my $infile = shift ;
my $input  = "STDIN" ;

if ( !$infile )
    {
    if (!$silent)
    {
    print STDERR "Reading form STDIN; (try: anubadok --help for usage or\n" ;
    print STDERR "see manpage for details.)\n" ;
    }
    }
elsif ( -e $infile )
    {
    open ( FILE, "<:utf8", $infile) 
        || die "Error! Couldn't open \"$infile\"! Exiting." ;
    $input = "FILE" ;
    }   
else    {
    print STDERR "Error! Couldn't find \"$infile\"! Exiting.\n" ;
    exit (1);
    }

Initialize::check_user_anubadok_dir();

open ( OUTFILE, ">:utf8", "anubadok_outfile" );
print OUTFILE "hello";
print OUTFILE "হেলেছি";
print OUTFILE "world";
print OUTFILE 
    XMLPP::xml_post_processor( 
        Translator::translate_in_bengali(
            PoSTagger::penn_treebank_tagger(
                XMLPP::xml_pre_processor(<$input>))));
close OUTFILE;

# print STDOUT
#   XMLPP::xml_post_processor( 
#       Translator::translate_in_bengali(
#           PoSTagger::penn_treebank_tagger(
#               XMLPP::xml_pre_processor(<$input>))));
...

Ниже приведен код PyGTK, который работает правильно, чтобы показать, как я использую Popen () для выполненияподпроцесс.Он выполняет программу Perl, и соответствующий вывод записывается в файл.Реальная программа длиннее в том, что она имеет больше виджетов для отображения и имеет дело с большими файлами для заполнения представлений и так далее.Нет другого логического различия, о котором я могу думатьЯ использую Popen () идентично, в реальной программе.Но, как ни странно, выходной файл, который записывается программой Perl, содержит только строку «hello, world», то есть выходные данные 3 операторов print.Вывод с 4-го отпечатка потерян.Если я использую STDOUT вместо OUTFILE в программе Perl и использую connect () для чтения объекта stdout, я обнаружу, что он пуст.В приведенном ниже коде, опять же, это работает правильно.

Что может быть причиной этого, и что я упускаю?

Если кто-то хочет на самом деле запустить эту программу, пожалуйста, получите копию Anubadok и включите этот дополнительный блок print OUTFILE в Perl-скрипт anubadok-0.2.1 / bin / anubadok.

#!/usr/bin/env python
import pygtk,sys,gtk,os,subprocess,pdb

class C:

   def main(self, argv=None):
      gtk.main()

   def __init__(self):

      # Main window
      self.window = gtk.Window(gtk.WINDOW_TOPLEVEL)
      self.window.set_border_width(2)
      self.window.set_position(gtk.WIN_POS_CENTER)
      self.window.connect("destroy", self._destroy_window)

      # TextView
      self.v = gtk.TextView()
      self.v.set_name("v")
      self.vsw = gtk.ScrolledWindow()
      self.vsw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
      self.vsw.add(self.v)

      # TextView
      self.v1 = gtk.TextView()
      self.v1.set_name("v1")
      self.v1sw = gtk.ScrolledWindow()
      self.v1sw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
      self.v1sw.add(self.v1)

      # TreeView
      self.model = gtk.ListStore(str, str)
      self.tv = gtk.TreeView(self.model)
      self.tv.connect("row-activated", self._f, self.v)
      self.tv.connect("row-activated", self._f, self.v1)
      self.c = gtk.CellRendererText()
      self.c1 = gtk.CellRendererText()
      self.col = gtk.TreeViewColumn("C", self.c, text=0)
      self.col1 = gtk.TreeViewColumn("C1", self.c1, text=1)
      self.tv.append_column(self.col)
      self.tv.append_column(self.col1)
      self.tvsw = gtk.ScrolledWindow()
      self.tvsw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
      self.tvsw.add(self.tv)

      self.fill_model(self.model)

      # Layout
      self.rbox = gtk.VBox(False, 0)
      self.rbox.pack_start(self.vsw, False, False, 0)
      self.rbox.pack_start(self.v1sw, False, False, 0)
      self.box = gtk.HBox(False, 0)
      self.box.pack_start(self.tvsw, False, False, 0)
      self.box.pack_start(self.rbox, False, False, 0)

      self.window.add(self.box)
      self.window.show_all()

   def fill_model(self, model):
      self.dbg("fill_model()")
      model.clear()
      fd = open("file", "r"); rows = fd.readlines(); fd.close()
      for l in rows:
          a = l.split()
          model.append([l[0], l[1]])
      return

   def _f(self, tview, path, column, textview):
       self.dbg("_f()")
       tsel = tview.get_selection()
       model, iter = tsel.get_selected()
       buf = textview.get_buffer()
       buf.set_text("")
       if(textview.get_name() == "v"):
           self.dbg("_f():v")
           buf.set_text("hello")
       elif(textview.get_name() == "v1"):
           self.dbg("_f():v1")
           x = "hello"
           t = self.g(x)
           buf.set_text(t)
       return

   def run(self, cmd):
      self.dbg("run()")
      """
      - Run command and return stdout as first argument of a
      tuple and stderr as the second argument of the tuple.
      - Returns None on error.
      """
      try:
         p = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
         p.wait()
         if p.returncode:
            print "failed with code: %s" % str(p.returncode)
         return p.communicate()
      except OSError:
         print "OSError"

   def g(self):
      # pdb.set_trace()
      self.dbg("g()")
      p = self.run(["/home/rup/ir/utils/anubadok-0.2.1/bin/anubadok", "file1"])
      return p[0]

   def _destroy_window(self, widget, data = None):
      self.dbg("_destroy_window()")
      gtk.main_quit()
      return

   def dbg(self, msg):
       sys.stderr.write("dbg: %s\n" % msg)

if __name__ == "__main__":
   ui = C()
   ui.main()

1 Ответ

1 голос
/ 01 июня 2011

И Perl, и Python чувствительны к переменным окружения, таким как LANG.Графические программы запуска и окна терминала часто передают разные значения своим дочерним элементам.

Я бы попробовал протестировать с вводом и выводом ASCII, распечатать STDERR, чтобы увидеть, есть ли предупреждения, и записать среду каждого процесса.

...