欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

C++ 读入文件中的中文字符

程序员文章站 2022-04-06 08:03:36
环境:C++,VS2013,32位WIN7转载:https://www.cnblogs.com/poemqiong/p/4609829.html一、文件类型为Unicode/// 函数功能: 读入文件内容/// 参考:http://blog.csdn.net/xiaobai1593/article/details/7060730///wstring readFileIntoStringuNNICODE(const char * filename) { ifstream ifile(fil...

环境:C++,VS2013,32位WIN7
转载:https://www.cnblogs.com/poemqiong/p/4609829.html
一、文件类型为Unicode

/// 函数功能: 读入文件内容
/// 参考:http://blog.csdn.net/xiaobai1593/article/details/7060730
///
wstring readFileIntoStringuNNICODE(const char * filename) {
    ifstream ifile(filename, ios::binary);
    wstring res;
    if (ifile) {
        wchar_t wc;
        while (!ifile.eof()) {
            ifile.read((char *)(&wc), 2);
            res = res + wc;
        }
    }
    ifile.close();
    return res;
}

二、文件类型为ANSI

///
/// 函数功能:读入ANSI文件中的中文字符
/// 参考:http://tieba.baidu.com/p/1865939813
///
wstring readFileIntoStringuANSI(const char * filename) {
    wifstream ifile(filename);
    wstring res;
    ifile.imbue(std::locale("CHS"));
    if (ifile) {
        wchar_t wc;
        while (!ifile.eof()) {
            ifile.read((&wc), 1);
            res = res + wc;
        }
    }
    ifile.close();
    return res;
}

CHS为简体中文的意思
w为宽的意思,即wstring是宽的string

char vs. wchar_t
char is supposed to hold a character, usually a 1-byte character.
wchar_t is supposed to hold a wide character, and then, things get
tricky: On Linux, a wchar_t is 4-bytes, while on Windows, it’s 2-bytes

imbue函数为更改区域设置

locale imbue(
   const locale& _Loc
);

C/C++程序中,locale(即系统区域设置,即国家或地区设置)将决定程序所使用的当前语言编码、日期格式、数字格式及其它与区域有关的设置,locale设置的正确与否将影响到程序中字符串处理(wchar_t如何输出、strftime()的格式等)。因此,对于每一个程序,都应该慎重处理locale设置。

C locale和C++ locale是独立的。C locale用setlocale(LC_CTYPE, “”)初始化,
C++ locale用std::locale::global(std::locale(“”))初始化。这样就可以根据当前运行环境正确设置locale。
basic_ios::eof

指示流的结尾是否已到达。

bool eof( ) const;

本文地址:https://blog.csdn.net/qq_45045793/article/details/109632833

相关标签: 算法笔记 c++