C++之父：C++ 的五个普遍误解（1）

程序员文章站 2022-03-25 11:48:49

...

[编注：为了增加您冬天阅读的乐趣，我们很荣幸的奉上Bjarne Stroustrup大神的这个包含3个部分的系列文章。这是第一部分；第二和第三部分将在接下来的两个周一发布，即在圣诞节之前完成这个系列。请欣赏。——Ed]

1. 简介

本系列包括 3 篇文章，我将向大家展示并澄清关于C++的五个普遍的误解：

“要理解C++，你必须先学习C”
“C++是一门面向对象的语言”
“为了软件可靠性，你需要垃圾回收”
“为了效率，你必须编写底层代码”
“C++只适用于大型、复杂的程序”

如果你深信上述误解中的任何一个，或者有同事深信不疑，那么这篇短文正是为你而写。对某些人，某些任务，在某些时间，其中一些误解曾经只是正确的。然而，在如今的C++，应用广泛使用的最先进的ISO C++ 2011编译器和工具，它们只是误解。

我认为这些误解是“普遍的”，是因为我经常听到。偶尔，它们有原因来支持，但是它们经常地被作为明显的、不需要理由的支持地表达出来。有时，它们成为某些场景下不考虑使用C++的理由。

每一个误解，都需要一大篇文章，甚至一本书来澄清，但是这里我的目标很简单，就是抛出问题，并简明地陈述我的原因。

2. 误解1：“要理解C++，你必须先学习C”

不。学习C++基础编程比学习C要容易地多。

C几乎是C++的一个子集，但是它不是最先要学习的最好的子集，因为C缺少计数支持，类型安全，和易用的标准库，而C++为简单任务提供了这些。考虑一个拼接email地址的简单函数：

string compose(const string& name, const string& domain)
{
  return name+'@'+domain;
}

它可能被这样使用

char* compose(const char* name, const char* domain)
{
  char* res = malloc(strlen(name)+strlen(domain)+2); // space for strings, '@', and 0
  char* p = strcpy(res,name);
  p += strlen(name);
  *p = '@';
  strcpy(p+1,domain);
  return res;
}

它可能被这样使用

char* addr = compose("gre","research.att.com");
// …
free(addr); // release memory when done

哪个版本你更愿意教？哪个版本更容易使用呢？刚才我的C版本代码写对了吗？你确定？为什么？

最后，哪个版本可能更有效率呢？是的，是C++版本。因为它不需要数参数中字符的个数，也不需要释放参数中短字符串的空间（动态内存）。

2.1 学习C++

这不是一个奇怪的孤立例子。我认为它是典型的。那为什么有那么多老师坚持“先学习C”的观点？

因为多年来他们一直这么做。
因为这是课程所要求的。
因为老师们年轻时就是这么学习的。
因为C比C++小，就认为C比C++简单。
因为学生们迟早要学习C（或者C++的C子集）。

然而，C并不是最先学习C++的最容易或者最常用的子集。更进一步，一旦你知道了C++的合理数量，C子集很容易学习。先学习C，会导致不断忍受错误，以及学习如何避免这些错误，而在C++中很容易避免这些错误。

对于用现代的方法教学C++，看我的书Programming: Principles and Practice Using C++。它甚至在结尾有一章，专门讲如何使用C。它在多个大学中数以万计的初学者中成功应用。为了灵活学习，这本书的第二版中使用了C++11和C++14工具。

在C++11[11-12]中，C++对初学者更友好。例如，标准库中使用元素序列初始化一个vector：

vector<int> v = {1,2,3,5,8,13};

在C++98中，我们只能使用列表来初始化数组。而在C++11中，我们可以定义一个构造函数，接收可以是任意需要类型的{}初始化列表。

我们能够使用range-for循环来遍历vector：

for(int x : v) test(x);

它将对v中的每一个元素，调用一次test()。

range-for循环可以遍历任意序列，因此我们可以直接使用初始化列表来简化上面的例子：

for (int x : {1,2,3,5,8,13}) test(x);

C++11的一个目标就是，让简单的事情简单化。自然地，它在没有增加性能负担的前提下实现了。

3. 误解2：“C++是一门面向对象的语言”

不。C++支持OOP和其他编程风格，但它并不局限于狭隘的“面向对象”。它综合地支持了包括面向对象和泛型编程技术。通常，一个问题的最优解决方案，包含不止一种风格（范例）。“最优”，我指的是最短、最易于理解、最有效率和最易于维护等。

“C++是一门面向对象的语言”使人们认为C++不是必要的（当与C做比较时），除非你需要一个巨大的类继承层次以及很多须函数（运行时多态）——对很多人和很多问题，这样应用并不合适。相信这个误区导致C++因为不是纯面向对象而遭到谴责；毕竟，如果你把“好”和“面向对象”等同起来，那么C++明显包含了很多不是面向对象的东西，一定会被认为是“不好”。不管是哪种情形，这个误解为不学习C++提供了一个很好的接口。

考虑一个例子：

void rotate_and_draw(vector<Shape*>& vs, int r)
{
  for_each(vs.begin(),vs.end(), [](Shape* p) { p->rotate(r); });  // rotate all elements of vs
  for (Shape* p : vs) p->draw();                                  // draw all elements of vs
}

它是面向对象的吗？当然是；它关键依赖类的虚函数机制。它是泛型吗？当然是；它关键依赖于一个参数化容器（vector）和泛型函数for_each。它是函数式吗？某种程度上；它使用了lambda表达式（[]构造器）。那么它到底是什么？它是现代C++：C++11。

我使用了range-for和标准库算法for_each，就是为了炫一下特性。在真实的代码中，不管我使用哪种方式，我只会使用一种循环。

3.1 泛型编程

你想让这段代码更通用吗？毕竟，它只在指向Shapes的指针向量中使用。如果使用列表和内置数组会怎么样？“智能指针”（资源管理指针）呢，例如shared_ptr和unique_ptr？对于那些你可以调用draw()和rotate()方法，但是类名称不是Shape的对象呢？考虑：

template<typename Iter>
void rotate_and_draw(Iter first, Iter last, int r)
{
  for_each(first,last,[](auto p) { p->rotate(r); });  // rotate all elements of [first:last)
  for (auto p = first; p!=last; ++p) p->draw();       // draw all elements of [first:last)
}

对于任意你需要从first遍历到last的序列，它能够运行。这就是C++标准库算法的风格。我使用了auto，来避免不得不对“类似shape的对象”的接口命名。这是一个C++11特性，即“使用表达式的类型初始化”，因此对于for循环，p的类型由第一次赋值的类型决定。使用auto来表示lambda参数类型是C++14的一个特性，但是已经在使用了。

考虑：

void user(list<unique_ptr<Shape>>& lus, Container<Blob>& vb)
{
  rotate_and_draw(lst.begin(),lst.end());
  rotate_and_draw(begin(vb),end(vb));
}

这里，我假设Blob是一个包含draw()和rotate()操作的图形类型，而Container是某种容器类型。标准库列表(std::list)有成员函数begin()和end()，来帮助用户遍历它序列的元素。这是经典的面向对象编程。但是如果Container不支持C++标准算法库遍历半开序列[b:e]的约定呢？如果不包含begin()和end()成员呢？好了，我还从来没有见过哪些容器类是不能被遍历的，因此我们可以定义适当语义的独立begin()和end()函数。这个标准库支持C样式的数组，因此如果Container是C样式的数组，问题能够解决——并且C样式的数组仍然很常见。

3.2 适应性

考虑一个更难的情况：如果容器包含对象指针，而且有着不同的访问和遍历模式呢？例如，假设你需要这样访问一个Container：

for (auto p = c.first(); p!=nullptr; p=c.next()) { /* do something with *p */}

这种风格并非不常见。我们可以把它转化成一个[b:e)序列：

template<typename T> struct Iter {
  T* current;
  Container<T>& c;
};
 
template<typename T> Iter<T> begin(Container<T>& c) { return Iter<T>{c.first(),c}; }
template<typename T> Iter<T> end(Container<T>& c)   { return Iter<T>{nullptr}; }
template<typename T> Iter<T> operator++(Iter<T> p)  { p.current = c.next(); return this; }
template<typename T> T*      operator*(Iter<T> p)   { return p.current; }

注意这种修改方式是非侵入式的：我不需要修改Container或者它的继承类，来把Container映射到支持C++标准算法的遍历模型。这是一种形式的适应，而不是重构。

我选择这个例子，是为了展示泛型编程技术并不局限于标准算法库（标准算法中它很常见）。同样，对大多数常见的“面向对象”定义，它们不是面向对象的。

C++代码必须是面向对象的想法（即到处使用类继承和虚方法），可能严重损坏效率。如果你需要一组类型的运行时解决方案，面向对象编程的观点是伟大的。我就经常使用它。然而，它是相对严格的（并不是每个类型都适应类继承），并且虚方法调用抑制了内链函数（它可以在一些简单而重要的场景中降低你50倍的速度）。

C++之父：C++ 的五个普遍误解（1）

C++ 的五个普遍误解（2）：垃圾回收

C++之父：C++ 的五个普遍误解（3）

C++之父：C++ 的五个普遍误解（1）

C++之父：C++ 的五个普遍误解（1）