Привет, программисты,
Я хочу читать построчно текстовый файл Unicode (UTF-8), созданный Notepad, я не хочу отображать строку Unicode на экране, я хочу просто читать и сравнивать строки!.
Этот код читает строку файла ANSI построчно и сравнивает строки
Что я хочу
Читать test_ansi.txt построчно
если строка = "b", выведите "YES!"
иначе выведите «НЕТ!»
read_ansi_line_by_line.c
#include <stdio.h>
int main()
{
char *inname = "test_ansi.txt";
FILE *infile;
char line_buffer[BUFSIZ]; /* BUFSIZ is defined if you include stdio.h */
char line_number;
infile = fopen(inname, "r");
if (!infile) {
printf("\nfile '%s' not found\n", inname);
return 0;
}
printf("\n%s\n\n", inname);
line_number = 0;
while (fgets(line_buffer, sizeof(line_buffer), infile)) {
++line_number;
/* note that the newline is in the buffer */
if (strcmp("b\n", line_buffer) == 0 ){
printf("%d: YES!\n", line_number);
}else{
printf("%d: NO!\n", line_number,line_buffer);
}
}
printf("\n\nTotal: %d\n", line_number);
return 0;
}
test_ansi.txt
a
b
c
Компиляция
gcc -o read_ansi_line_by_line read_ansi_line_by_line.c
выход
test_ansi.txt
1: NO!
2: YES!
3: NO!
Total: 3
Теперь мне нужно прочитать файл Unicode (UTF-8), созданный Notepad, после более чем 6 месяцев я не нашел ни одного хорошего кода / библиотеки в C, который мог бы читать файл, кодированный в UTF-8 !, я не знаю именно поэтому, но я думаю, что стандартный C не поддерживает Unicode!
Чтение двоичного файла Unicode - нормально, но проблема в том, что двоичный файл чаще всего уже создается в двоичном режиме !, это означает, что если мы хотим прочитать файл Unicode (UTF-8), созданный Notepad, нам нужно перевести его из Файл UTF-8 в двоичный файл!
Этот код записывает строку Unicode в двоичный файл, ПРИМЕЧАНИЕ. Файл C кодируется в UTF-8 и компилируется GCC
.
Что я хочу
Записать символ Unicode "ب" в test_bin.dat
create_bin.c
#define UNICODE
#ifdef UNICODE
#define _UNICODE
#else
#define _MBCS
#endif
#include <stdio.h>
#include <wchar.h>
int main()
{
/*Data to be stored in file*/
wchar_t line_buffer[BUFSIZ]=L"ب";
/*Opening file for writing in binary mode*/
FILE *infile=fopen("test_bin.dat","wb");
/*Writing data to file*/
fwrite(line_buffer, 1, 13, infile);
/*Closing File*/
fclose(infile);
return 0;
}
1042 * Компиляция *
gcc -o create_bin create_bin.c
выход
create test_bin.dat
Теперь я хочу прочитать двоичный файл построчно и сравнить!
Что я хочу
Читать test_bin.dat построчно
если строка = "ب" выведите "YES!"
иначе выведите «НЕТ!»
read_bin_line_by_line.c
#define UNICODE
#ifdef UNICODE
#define _UNICODE
#else
#define _MBCS
#endif
#include <stdio.h>
#include <wchar.h>
int main()
{
wchar_t *inname = L"test_bin.dat";
FILE *infile;
wchar_t line_buffer[BUFSIZ]; /* BUFSIZ is defined if you include stdio.h */
infile = _wfopen(inname,L"rb");
if (!infile) {
wprintf(L"\nfile '%s' not found\n", inname);
return 0;
}
wprintf(L"\n%s\n\n", inname);
/*Reading data from file into temporary buffer*/
while (fread(line_buffer,1,13,infile)) {
/* note that the newline is in the buffer */
if ( wcscmp ( L"ب" , line_buffer ) == 0 ){
wprintf(L"YES!\n");
}else{
wprintf(L"NO!\n", line_buffer);
}
}
/*Closing File*/
fclose(infile);
return 0;
}
выход
test_bin.dat
YES!
ПРОБЛЕМА
Этот метод ОЧЕНЬ ДЛИТЕЛЬНЫЙ! и НЕ МОЩНЫЙ (я новичок в разработке программного обеспечения)
Пожалуйста, кто-нибудь знает, как читать Unicode-файл? (Я знаю, это не легко!)
Кто-нибудь знает, как конвертировать файл Unicode в двоичный файл? (простой метод)
Кто-нибудь знает, пожалуйста, как прочитать файл Unicode в двоичном режиме? (я не уверен)
Спасибо.