Это странная проблема.Я начал работать над этим в этом потоке , и теперь он превратился во что-то немного другое.
Я использую Popen () для выполнения Perl-программы anubadok.Программа Perl записывает свой вывод в файл.Вот фрагмент кода Perl, который делает это.4-й.оператор print (после открытия OUTFILE ...) записывает неанглийские символы Юникода (бенгальский).Я добавил 3 строки печати перед ним, чтобы проверить, правильно ли пишутся все символы Юникода.
...
my $infile = shift ;
my $input = "STDIN" ;
if ( !$infile )
{
if (!$silent)
{
print STDERR "Reading form STDIN; (try: anubadok --help for usage or\n" ;
print STDERR "see manpage for details.)\n" ;
}
}
elsif ( -e $infile )
{
open ( FILE, "<:utf8", $infile)
|| die "Error! Couldn't open \"$infile\"! Exiting." ;
$input = "FILE" ;
}
else {
print STDERR "Error! Couldn't find \"$infile\"! Exiting.\n" ;
exit (1);
}
Initialize::check_user_anubadok_dir();
open ( OUTFILE, ">:utf8", "anubadok_outfile" );
print OUTFILE "hello";
print OUTFILE "হেলেছি";
print OUTFILE "world";
print OUTFILE
XMLPP::xml_post_processor(
Translator::translate_in_bengali(
PoSTagger::penn_treebank_tagger(
XMLPP::xml_pre_processor(<$input>))));
close OUTFILE;
# print STDOUT
# XMLPP::xml_post_processor(
# Translator::translate_in_bengali(
# PoSTagger::penn_treebank_tagger(
# XMLPP::xml_pre_processor(<$input>))));
...
Ниже приведен код PyGTK, который работает правильно, чтобы показать, как я использую Popen () для выполненияподпроцесс.Он выполняет программу Perl, и соответствующий вывод записывается в файл.Реальная программа длиннее в том, что она имеет больше виджетов для отображения и имеет дело с большими файлами для заполнения представлений и так далее.Нет другого логического различия, о котором я могу думатьЯ использую Popen () идентично, в реальной программе.Но, как ни странно, выходной файл, который записывается программой Perl, содержит только строку «hello, world», то есть выходные данные 3 операторов print.Вывод с 4-го отпечатка потерян.Если я использую STDOUT вместо OUTFILE в программе Perl и использую connect () для чтения объекта stdout, я обнаружу, что он пуст.В приведенном ниже коде, опять же, это работает правильно.
Что может быть причиной этого, и что я упускаю?
Если кто-то хочет на самом деле запустить эту программу, пожалуйста, получите копию Anubadok и включите этот дополнительный блок print OUTFILE в Perl-скрипт anubadok-0.2.1 / bin / anubadok.
#!/usr/bin/env python
import pygtk,sys,gtk,os,subprocess,pdb
class C:
def main(self, argv=None):
gtk.main()
def __init__(self):
# Main window
self.window = gtk.Window(gtk.WINDOW_TOPLEVEL)
self.window.set_border_width(2)
self.window.set_position(gtk.WIN_POS_CENTER)
self.window.connect("destroy", self._destroy_window)
# TextView
self.v = gtk.TextView()
self.v.set_name("v")
self.vsw = gtk.ScrolledWindow()
self.vsw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
self.vsw.add(self.v)
# TextView
self.v1 = gtk.TextView()
self.v1.set_name("v1")
self.v1sw = gtk.ScrolledWindow()
self.v1sw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
self.v1sw.add(self.v1)
# TreeView
self.model = gtk.ListStore(str, str)
self.tv = gtk.TreeView(self.model)
self.tv.connect("row-activated", self._f, self.v)
self.tv.connect("row-activated", self._f, self.v1)
self.c = gtk.CellRendererText()
self.c1 = gtk.CellRendererText()
self.col = gtk.TreeViewColumn("C", self.c, text=0)
self.col1 = gtk.TreeViewColumn("C1", self.c1, text=1)
self.tv.append_column(self.col)
self.tv.append_column(self.col1)
self.tvsw = gtk.ScrolledWindow()
self.tvsw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
self.tvsw.add(self.tv)
self.fill_model(self.model)
# Layout
self.rbox = gtk.VBox(False, 0)
self.rbox.pack_start(self.vsw, False, False, 0)
self.rbox.pack_start(self.v1sw, False, False, 0)
self.box = gtk.HBox(False, 0)
self.box.pack_start(self.tvsw, False, False, 0)
self.box.pack_start(self.rbox, False, False, 0)
self.window.add(self.box)
self.window.show_all()
def fill_model(self, model):
self.dbg("fill_model()")
model.clear()
fd = open("file", "r"); rows = fd.readlines(); fd.close()
for l in rows:
a = l.split()
model.append([l[0], l[1]])
return
def _f(self, tview, path, column, textview):
self.dbg("_f()")
tsel = tview.get_selection()
model, iter = tsel.get_selected()
buf = textview.get_buffer()
buf.set_text("")
if(textview.get_name() == "v"):
self.dbg("_f():v")
buf.set_text("hello")
elif(textview.get_name() == "v1"):
self.dbg("_f():v1")
x = "hello"
t = self.g(x)
buf.set_text(t)
return
def run(self, cmd):
self.dbg("run()")
"""
- Run command and return stdout as first argument of a
tuple and stderr as the second argument of the tuple.
- Returns None on error.
"""
try:
p = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
p.wait()
if p.returncode:
print "failed with code: %s" % str(p.returncode)
return p.communicate()
except OSError:
print "OSError"
def g(self):
# pdb.set_trace()
self.dbg("g()")
p = self.run(["/home/rup/ir/utils/anubadok-0.2.1/bin/anubadok", "file1"])
return p[0]
def _destroy_window(self, widget, data = None):
self.dbg("_destroy_window()")
gtk.main_quit()
return
def dbg(self, msg):
sys.stderr.write("dbg: %s\n" % msg)
if __name__ == "__main__":
ui = C()
ui.main()